基于BERT双向预训练的图模型摘要抽取算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:lxmcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
算法大多是基于监督学习机制,没有考虑到人工标记语料的烦琐,并且大多数摘要模型在句子嵌入时不能结合上下文来更充分表达语义信息,忽略了文本的整体信息。针对上述问题提出了一种基于改进的BERT双向预训练语言模型与图排序算法结合的抽取式摘要模型。根据句子的位置以及上下文信息将句子映射为结构化的句子向量,再结合图排序算法选取影响程度靠前的句子组成临时摘要;为了避免得到有较高冗余度的摘要,对得到的临时摘要进行冗余消除。实验结果表明在公用数据集CNN/DailyMaily上,所提模型能够提高摘要的得分,相对于其他
其他文献
目的观察系统护理干预对经皮肾镜治疗输尿管结石患者术后疼痛、并发症发生情况的影响。方法选取2019年3月-2020年3月在我院采用经皮肾镜治疗输尿管结石的82例患者为研究对象。采用随机数字表法分为对照组和观察组,各41例。对照组给予常规护理,观察组实施系统化护理干预,比较两组患者术后不同时间段(术后第1、5天)疼痛(VAS)评分、手术指标(术后胃肠功能恢复时间、住院时间、住院费用)、并发症发生率及护理满意度。结果观察组术后第1、5天VAS评分均低于对照组,差异有统计学意义(P<0.05);观察组术后胃
【目的】探究琯溪蜜柚汁胞粒化与次生壁纤维素含量、自由水和束缚水含量、品质等指标的相关性以及纤维素合成酶基因表达情况,以期为汁胞粒化过程中次生壁形成的分子调控机制研究提供依据。【方法】选取2018年8、9、10和11月4个时期的琯溪蜜柚果实,测定汁胞粒化率、可溶性固形物(total soluble solid,TSS)、可滴定酸(titratable acid,TA)、含水量和纤维素含量。从汁胞转录组中筛选差异表达的纤维素合酶基因(cellulose synthase,CESA)并进行分类和表达分析。【结果
对加密算法的识别是进行密码分析的首要工作。目前的识别方案涵盖了分组密码的识别、流密码的识别以及对称密码和公钥密码混合算法的识别。随着国密算法的应用普及,其安全性也备受关注。针对国密算法提出了基于随机性特征的SM4分组密码体制识别,将国密SM4算法与国际主要标准分组密码算法进行识别。利用随机性测试方法对密文进行特征提取,从而得到特征向量,由这些特征向量构成特征空间,最后借助机器学习算法对特征空间进行
CRAFT是FSE 2019年提出的一种轻量级可调分组密码,适用于硬件实现面积小且资源受限设备保护信息的安全。该算法使用128 bit密钥和64 bit调柄值加密64 bit明文,对其进行安全性评估,可以为日后使用提供理论依据。通过研究CRAFT的结构特点和密钥编排方案的冗余性,利用预计算表、等效密钥和轮密钥线性关系等技术,选取一条充分利用密钥冗余性的13轮不可能差分链,在其前后分别接3轮和5轮,
针对时空正则化相关滤波跟踪算法在背景混乱、光照变化等挑战场景下跟踪结果与正确目标位置总是存在偏离的问题,提出了采用多边形位置校正的时空正则化相关滤波跟踪算法,以提高跟踪结果的准确性和鲁棒性。该算法采用峰值噪声比对当前跟踪结果的置信度进行判别,对置信度判别结果为不可信的情况采用多边形位置校正方法对当前跟踪结果进行修正。实验表明,该算法在成功率曲线下面积和精度两种评价标准下都有较大的提升,尤其是在背景
多电压设计(multiple supply voltage,MSV)是降低SoC功耗的有效方法之一。为便于电压岛供电引脚的放置,提出了一种考虑电压岛边界约束的多电压布图算法。首先,基于切分树表示的布图解特点,提出一种边界检查算法快速确定所有模块的边界信息。其次,以优化功耗为目标采用改进动态规划方法进行多电压分配并构建电压岛。最后,以模拟退火算法作为搜索引擎对芯片的面积、线长和功耗进行协同优化。为减
[目的]超超临界机组是国内发电主力机组,对水汽质量要求严格,文章提出水汽质量控制措施以防止热力系统产生结垢和腐蚀,保证机组安全经济运行。[方法]为控制超超临界机组水汽质量,应该选择恰当的除盐水生产工艺、可靠的凝结水精处理系统、采取给水加氧处理(OT)、设置合理的在线监测表计、选择合适的凝汽器管材及做好停炉保护。[结果]以上措施可以有效防止热力系统产生结垢和腐蚀,保证机组安全经济运行。[结论]超超临界参数机组水汽质量可参考《火力发电机组及蒸汽动力设备水汽质量》(GB/T 12145—2016),并推荐按期望
[目的]双馈风机(DFIG)的低电压穿越(LVRT)性能在一定程度上依赖于控制参数的优化,而目前对控制参数的优化基本都是离线模式,原因在于优化算法难以满足实时控制对计算速度的要求。[方法]基于深度神经网络(DNN)原理,提出基于“离线训练、在线计算”思路的低电压穿越实时优化控制方法。首先针对含DFIG电网在不同运行方式下发生的大量不同故障进行控制参数的离线优化并形成相应的LVRT优化控制策略,将不同的故障状态进行归类并形成成对的故障模式和参数表,从而构成深度神经网络的训练样本。[结果]电网故障瞬间可以将输
[目的]随着城市的发展,电厂逐步由“外”向“内”发生变化,单一的建筑设计已无法满足处于城市中的电厂设计,以黄埔电厂为例,为同类型——城市型燃机电厂设计提供借鉴。[方法]通过分析、整合、利用,使多种不利因素转变为电厂去工业化的元素,丰富去工业化设计的内涵。[结果]文章分析了黄埔电厂在土地利用、建筑表皮、降噪和景观绿化等方面的具体设计理念及手法。[结论]黄埔电厂作为城市型燃机电厂,展现出的去工业化设计理念,延伸了现代工业建筑设计的范围,并提供了更多元化的设计手法。
为了解决现有推荐算法仅考虑同类产品间单向推荐所缺乏的灵活性,提升产品的销量及用户的购物体验,提出一种基于客户喜好的双向个性化推荐算法,不仅可以为客户精准推荐产品,还可以为商家推荐潜在客户。首先,基于产品购买网络中客户及其邻居的购买信息,扩展客户购买信息;其次设计客户产品喜好权重计算办法,分析客户的购买喜好,并在客户喜好的指导下为客户提供个性化的产品推荐;最后,基于商家提供的样本客户,挖掘与样本客户