生物医学事件抽取技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:huzhouweno
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学事件抽取技术,能够帮助研究人员快速地从大量生物医学文献中准确定位事件,并以结构化的形式表示,在药物研制、临床辅助诊疗、构建生物医学本体库等方面具有重要的研究意义和应用价值。生物医学事件描述了生物医学实体状态变化的过程,主要由触发词和事件元素组成。本文围绕生物医学事件抽取关键技术展开研究,重点探索了基于深度学习方法的触发词识别和事件元素识别技术。本文的主要研究内容如下:(1)融入自注意力机制的生物医学事件触发词识别。触发词代表了事件发生的动作(比如:抑制、发展和形成等)及事件的类型。本文针对触发词识别任务中由于文本中存在大量复杂事件,从而造成了对文本内部包含的特征挖掘不充分的问题,提出了一种融入自注意力机制的事件触发词识别方法。该方法重点关注于文本自身,在引入单词分布式语义特征的基础上,采用双向门控循环单元网络捕获相关上下文特征,并在双向门控循环单元网络中融入了自注意力机制从多层面充分的挖掘文本自身包含的特征,来更好地理解和表示句子所表达的语义信息。最后融合词级特征通过分类层对触发词进行分类。(2)基于卷积神经网络、双向门控循环单元网络和注意力机制的事件元素识别。事件元素是事件发生时所涉及到的参与元素,主要是生物医学实体或者其他事件。本文将事件元素识别任务视作一种关系抽取任务,对事件元素及其类型进行识别分类。由于事件元素识别任务中一个句子中可能包含多个触发词,且一个触发词可能对应多个元素,因此需要提取更深层次的语义特征进行区分用于关系分类。本文提出了一种基于联合网络的事件元素识别方法,引入依存关系信息,领域词向量,距离特征,事件及实体类型特征来丰富语义特征,结合卷积神经网络以及双向门控循环单元网络两者的优势对深层特征进行有效地提取,并引入注意力机制关注更重要的特征信息,提升分类精度。最后,根据生物医学事件的特点,对事件元素识别结果进行规则后处理,生成最终事件。通过在MLEE数据集上实验发现,在事件触发词识别以及事件元素识别任务上,与已有的方法相比,本文提出的方法均取得了更高的综合性能,证明了本文提出的方法在这两个任务上的合理性和有效性。
其他文献
咔唑类化合物是一类重要的含氮芳杂环,分子内含有较大的共轭体系和强的分子内电子转移能力,这种特殊的刚性稠环结构使咔唑类化合物表现出许多独特的性能及生物活性,从而在医
聚合物介电复合材料介电性能良好,还具有柔韧、良好的机械力学性能,已成为制备电子元器件的重要材料。本论文将纳米钛酸钡(BaTiO3)粒子与环氧功能化有机硅树脂复合,制备聚合物
作为计算机视觉领域的一个主流方向,目标跟踪具有重要的研究意义和广泛的商业价值,越来越引起计算机视觉研究者的密切关注。近年来,在国内外研究人员的努力下,以相关滤波和深
卷积神经网络(Convolutional Neural Networks,CNN)模型具有非常出色的学习能力,它将图像数据直接输入,在无需人工对图像进行预处理和额外的特征抽取等复杂操作的同时以其特
激光诱导击穿光谱技术作为一种元素分析技术,具有多元素联测、在线、原位分析等优点,在生物医学、环境监测、文物考古等多个领域都有非常重要的应用,随着激光器、光谱仪的快
随着计算机视觉技术在游戏、医学、测绘、虚拟现实等领域的广泛应用,基于图像的三维建模成为热门的研究方向。其中,被动式单目重建算法虽然流程复杂、运行时间长,但其扩展性
随着全球水资源缺乏及土壤与淡水盐渍化加剧,干旱、高盐等非生物逆境已经成为影响作物生长发育的主要因素,严重影响了作物的产量。因此利用转基因技术提高作物的逆境性是主要
氧电极反应包括氧还原反应(oxygen reduction reaction,ORR)和析氧反应(oxygen evolution reaction,OER)是不同能量转换和存储体系的重要反应,其反应过程复杂、能垒较高,通常需要
水声数据可视化是人类探索海洋世界的重要手段,在海洋资源探测、海底地貌勘察以及渔业领域等方面具有广泛的应用。随着GPU等并行处理技术的发展,绘制质量较高的直接体绘制技
分子泵抽速性能对于分子泵基础理论的研究和发展、性能改进以及配套的真空系统设计方法完善都极为重要,快速、准确、有效地对分子泵抽速性能指标进行测试已经成为真空泵行业