方面级情感分析技术研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:secretcode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
方面级情感分析(Aspect-based Sentiment Analysis,ABSA)从文本中识别对象实体的多个方面,判断每个方面的情感极性,是文本情感分析中的一个重要的研究方向。目前关于ABSA的研究主要聚焦于文本中方面、情感、观点词三元组联合提取,也被称为方面级情感三元组提取(Aspect Sentiment Tuple Extraction,ASTE)。通过ASTE得到的情感信息不仅可以帮助组织机构快速地分析产品质量与优化服务,也能够服务于个人的行为决策。
  ASTE多任务联合学习使情感分析工作变得相对复杂。目前,ASTE的主流研究方法采用两阶段的管道模型方法,第一阶段提取方面、方面情感以及观点词,第二阶段对方面与观点词进行配对。管道模型方法存在以下不足:(1)需要训练两个模型,导致模型结构与训练过程相对复杂。(2)先提取、再配对的处理过程可能会导致误差的传递。此外,ASTE多任务联合使得训练数据集构建过程更加复杂,并且不同领域间的方面差别较大、数据集复用性低,导致相关研究缺乏合适的训练数据集,严重限制ASTE的研究进展。针对以上问题,本文主要的工作如下:
  第一,提出了一个基于区间特征统一的ASTE模型(A Span-based Unified Model for ASTE,SUM-ASTE)同时处理ASTE的三个任务,获取方面、情感、观点词三元组。针对管道模型方法中方面与观点词的配对过程存在误差传递的问题,SUM-ASTE模型引入方面的区间(边界词)特征,使用该特征提取属于方面的观点词,消除配对过程。此外,管道模型方法使用序列标注方法获取方面情感,可能存在方面内多个词的情感标签不一致的问题,SUM-ASTE使用方面区间特征获取方面的情感极性,能够有效避免此问题。对比管道方法中多模型框架,SUM-ASTE是一个整体的模型结果,模型结构简单并且能更加高效地利用方面、情感、观点词三元之间的关系。本文通过实验证明,对比管道模型方法SUM-ASTE在方面、情感、观点词三元提取上有更好的表现。
  第二,使用基于模型共享的迁移学习方法进一步地优化SUM-ASTE,减轻模型对训练数据的依赖。为了获取到句子级情感分析与方面级情感分析之间共有的语义知识,本文根据源模型的特征粒度,提出基于句子级别特征的迁移源模型与基于方面级别特征的迁移源模型,分别在句子级情感数据集上对源模型进行情感分类训练,获取情感相关语义知识。在得到源模型后,本文使用迁移源模型初始化源模型与SUM-ASTE之间共享的网络参数,通过模型参数共享的方式将语义知识迁移到目标模型SUM-ASTE中。此外,模型共享的方法能够赋予SUM-ASTE一个良好的模型初始化参数,有助于模型训练学习。本文通过实验证明使用迁移学习增强的SUM-ASTE模型在各项评价指标上都取得了更好的效果。
其他文献
屈原和陶渊明在中国知识分子心中一直以来代表着“仕”和“隐”两种截然不同的道路选择,但是在文学批评史中却出现了屈陶并称这一独特的现象。屈陶并称在魏晋南北朝时期初步发展,颜延之将屈视为知音,陶视为挚友,肯定了他们相通的高洁品格,是屈陶并称精神特征层面的萌芽。钟嵘通过《诗品》首先提出了屈原与陶渊明之间的直接联系,是后世认识屈陶并称的理论基础。唐代的大致趋势是,唐代初期文人对陶渊明的推崇是高于屈原的,但是
学位
墓志,是一种埋在墓穴中的石刻文字,是目前遗存最多的石刻形式。北齐墓志,是北朝石刻的特殊组成部分,在中国书法史上有其自身的特色。北齐统治的核心地区是邺城,其政治、经济、文化的发展相对稳定,邺城及其周边地区留下了数量可观的墓志。  本文以《北齐墓志书法研究》为题,以北齐时期最常见的墓志作为研究对象,试图对当前出土的北齐墓志进行整理。从北齐时期社会的政治、经济、文化背景方面入手,准确把握时代脉络,针对不
学位
肺癌是世界上最致命和最常见的癌症,每年约有13%的癌症被诊断为肺癌。肺癌分为非小细胞肺癌(NSCLC)和小细胞肺癌(SCLC),其中非小细胞肺癌(NSCLC)约占所有肺癌的80%至85%。NSCLC根据其组织学特征,可进一步分为肺腺癌、鳞状细胞癌和大细胞癌。1/3左右的NSCLC患者初诊就被诊断为晚期肺癌,基本丧失手术机会。虽然肺癌的治疗可以采用化学疗法、辐射疗法以及免疫疗法,但现有的治疗手段副作
学位
学位
学位
随着科技的进步与发展,无线网络中出现了大量无线终端,对网络吞吐量提出了更高要求。现有的无线网络难以应对这样的发展趋势,为此学术界和产业界提出了若干种提高网络吞吐量的无线技术,其中包括大规模天线阵列(Massive MIMO)、同时同频全双工(Co-frequency Co-time Full Duplex,CCFD)、非正交多址技术(Non-Orthogonal Multiple Access,N
真空脱气法简称VD(Vacuum Degassing,VD)法,是指精炼炉在一定条件下根据真空脱气与吹氩搅拌原理生产低碳钢的一种炉外精炼技术。VD炉精炼可用于严格控制钢水的温度,只有准确控制VD炉出工位温度,才可以对连铸环节的顺利进行提供了一个保障,从而提高钢材的质量。  为解决目前VD炉精炼系统中存在自动化程度低和冶炼过程依靠人工经验操作,从而导致终点命中率低的问题。本文以某钢厂VD炉精炼工艺过
伴随着大数据时代的兴起,数据已成为驱动经济发展的新能源。如何从海量的数据中准确地检索到用户需求的数据,并从中挖掘出有价值的信息,已成为当下信息检索领域的研究热点。  目前,自然语言处理领域广泛使用词向量作为神经网络模型的输入。实验证明:相对于词袋模型,使用词向量能显著提升模型性能。但是传统词向量无法有效地对上下文进行建模,难以解决词的歧义性问题。2018年谷歌发布预训练语言模型BERT,通过编码上