否定信息识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:syhrgl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
否定是存在于所有语言中一种复杂的语言现象,能对句子或词语包含的语义信息进行反转。越来越多的自然语言处理任务需要从文本信息中挖掘出有价值的信息,否定的存在将会导致挖掘到无用甚至完全相反含义的信息,对任务的性能产生消极影响。因此,需要对否定信息进行识别,将文本信息中肯定信息与否定信息分离,并进一步识别出否定的作用范围,从而获得句子表达的正确含义,同时也能提升情感分析、信息检索、信息抽取等任务的性能。本文主要围绕汉语和英语的否定触发词识别任务、否定覆盖域识别展开了以下工作:1)使用双向长短期记忆网络结合条件随机场为模型对汉语和英语分别进行否定触发词识别和否定覆盖域识别。该模型能够克服条件随机场严重依赖人工提取特征的缺点和双向长短期记忆网络没有从全局考虑标签序列的缺点,仅以预训练的词向量作为输入进行否定触发词识别,在此基础上添加标准触发词特征进行否定覆盖域识别。实验证明:在汉语和英语语料上,基于该模型的否定触发词识别和否定覆盖域识别都获得了较好的实验结果,并且该模型在英语语料的生物医学领域不同文本之间具有较强的泛化能力。2)融合自注意力机制进行否定覆盖域识别。针对否定覆盖域较长时难以识别完整的问题,自注意力机制层通过计算句子内部任意两个词语的相似性来拉近任意两个词语之间的距离,提升了模型学习长远上下文依赖的能力。实验结果证明,该方法对提升否定覆盖域识别性能有重要意义。3)融入依存句法信息进行否定覆盖域识别。否定覆盖域是否定触发词的作用范围,在依存句法上存在支配和被支配的关系,因此在BiLSTM-CRF模型的基础上,通过融入依存句法信息来拉近依存关系词语之间的距离以提升双向LSTM层学习长远上下文依赖关系的能力。实验结果表明,在表达较为规范的语料上,该方法能提升否定覆盖域识别的效果。
其他文献
图像特征提取是指从图像中提取出有利于图像视觉任务的特征表达,其表达能力直接影响图像视觉任务的性能。近年来,深度学习极大地提升特征表达的泛化能力,性能表现优于传统学
随着石油勘探理论的不断发展,近年来,国内外低渗透储层勘探与开发方面取得了一定进展。本文针对渤南油田沙四油层组面临产能低、非均质性强、物性差、规律性差等问题,综合利
X射线自由电子激光(XFEL)是新一代的高亮度光源。目前,美国、德国、瑞士、意大利、日本、韩国、中国等各国家都纷纷兴建自由电子激光大科学装置。自由电子激光是一种基于直线
在基于兴趣的好友推荐中,通常需要计算不同用户间的相似度来进行推荐。但是当用户量特别庞大时,计算所有用户之间的兴趣相似度需要消耗大量的时间。为了节约时间开销,本文在I
水声通信在海洋资源勘探领域具有广泛的用途和良好的应用前景,因此水声通信领域的相关研究得到了越来越多的重视。水声通信资源分配作为水声通信研究领域重要的一部分成为一
随着国家深入实施创新驱动发展战略,加快建设创新型国家步伐,推动经济高质量发展,科技创新作为着力点和核心驱动力,其重要性与日俱增。教育部直属985高等学校作为我国知识创
探地雷达作为一种快速无损的地球物理探测手段,已经被成功应用于许多领域。它通过发射高频电磁波进入地下介质,在遇到介质特性差异较大的界面发生反射,从而实现对地下目标的
近年来,光纤传感系统受到越来越多的关注,与传统的电学传感系统相比,光纤传感系统抗电磁干扰能力强,体积小,重量轻,机械性能好,并对温度、湿度、压强等外界条件的变化更加灵
近三十年来,多带小波的一般理论逐渐趋于成熟,但是M-带线性相位正交小波的设计仍然是非常困难的,尤其是当多带小波的带数较大的时候.本文主要研究了两类六-带线性相位正交滤
作为各种元器件的载体与电路信号传输的枢纽,印刷电路板(Printed circuit board,PCB)已经成为电子信息产品的关键部分。近年来,柔性电路(Flexible printed circuit,FPC)的研