论文部分内容阅读
方面级情感分析(Aspect-based Sentiment Analysis,ABSA)从文本中识别对象实体的多个方面,判断每个方面的情感极性,是文本情感分析中的一个重要的研究方向。目前关于ABSA的研究主要聚焦于文本中方面、情感、观点词三元组联合提取,也被称为方面级情感三元组提取(Aspect Sentiment Tuple Extraction,ASTE)。通过ASTE得到的情感信息不仅可以帮助组织机构快速地分析产品质量与优化服务,也能够服务于个人的行为决策。
ASTE多任务联合学习使情感分析工作变得相对复杂。目前,ASTE的主流研究方法采用两阶段的管道模型方法,第一阶段提取方面、方面情感以及观点词,第二阶段对方面与观点词进行配对。管道模型方法存在以下不足:(1)需要训练两个模型,导致模型结构与训练过程相对复杂。(2)先提取、再配对的处理过程可能会导致误差的传递。此外,ASTE多任务联合使得训练数据集构建过程更加复杂,并且不同领域间的方面差别较大、数据集复用性低,导致相关研究缺乏合适的训练数据集,严重限制ASTE的研究进展。针对以上问题,本文主要的工作如下:
第一,提出了一个基于区间特征统一的ASTE模型(A Span-based Unified Model for ASTE,SUM-ASTE)同时处理ASTE的三个任务,获取方面、情感、观点词三元组。针对管道模型方法中方面与观点词的配对过程存在误差传递的问题,SUM-ASTE模型引入方面的区间(边界词)特征,使用该特征提取属于方面的观点词,消除配对过程。此外,管道模型方法使用序列标注方法获取方面情感,可能存在方面内多个词的情感标签不一致的问题,SUM-ASTE使用方面区间特征获取方面的情感极性,能够有效避免此问题。对比管道方法中多模型框架,SUM-ASTE是一个整体的模型结果,模型结构简单并且能更加高效地利用方面、情感、观点词三元之间的关系。本文通过实验证明,对比管道模型方法SUM-ASTE在方面、情感、观点词三元提取上有更好的表现。
第二,使用基于模型共享的迁移学习方法进一步地优化SUM-ASTE,减轻模型对训练数据的依赖。为了获取到句子级情感分析与方面级情感分析之间共有的语义知识,本文根据源模型的特征粒度,提出基于句子级别特征的迁移源模型与基于方面级别特征的迁移源模型,分别在句子级情感数据集上对源模型进行情感分类训练,获取情感相关语义知识。在得到源模型后,本文使用迁移源模型初始化源模型与SUM-ASTE之间共享的网络参数,通过模型参数共享的方式将语义知识迁移到目标模型SUM-ASTE中。此外,模型共享的方法能够赋予SUM-ASTE一个良好的模型初始化参数,有助于模型训练学习。本文通过实验证明使用迁移学习增强的SUM-ASTE模型在各项评价指标上都取得了更好的效果。
ASTE多任务联合学习使情感分析工作变得相对复杂。目前,ASTE的主流研究方法采用两阶段的管道模型方法,第一阶段提取方面、方面情感以及观点词,第二阶段对方面与观点词进行配对。管道模型方法存在以下不足:(1)需要训练两个模型,导致模型结构与训练过程相对复杂。(2)先提取、再配对的处理过程可能会导致误差的传递。此外,ASTE多任务联合使得训练数据集构建过程更加复杂,并且不同领域间的方面差别较大、数据集复用性低,导致相关研究缺乏合适的训练数据集,严重限制ASTE的研究进展。针对以上问题,本文主要的工作如下:
第一,提出了一个基于区间特征统一的ASTE模型(A Span-based Unified Model for ASTE,SUM-ASTE)同时处理ASTE的三个任务,获取方面、情感、观点词三元组。针对管道模型方法中方面与观点词的配对过程存在误差传递的问题,SUM-ASTE模型引入方面的区间(边界词)特征,使用该特征提取属于方面的观点词,消除配对过程。此外,管道模型方法使用序列标注方法获取方面情感,可能存在方面内多个词的情感标签不一致的问题,SUM-ASTE使用方面区间特征获取方面的情感极性,能够有效避免此问题。对比管道方法中多模型框架,SUM-ASTE是一个整体的模型结果,模型结构简单并且能更加高效地利用方面、情感、观点词三元之间的关系。本文通过实验证明,对比管道模型方法SUM-ASTE在方面、情感、观点词三元提取上有更好的表现。
第二,使用基于模型共享的迁移学习方法进一步地优化SUM-ASTE,减轻模型对训练数据的依赖。为了获取到句子级情感分析与方面级情感分析之间共有的语义知识,本文根据源模型的特征粒度,提出基于句子级别特征的迁移源模型与基于方面级别特征的迁移源模型,分别在句子级情感数据集上对源模型进行情感分类训练,获取情感相关语义知识。在得到源模型后,本文使用迁移源模型初始化源模型与SUM-ASTE之间共享的网络参数,通过模型参数共享的方式将语义知识迁移到目标模型SUM-ASTE中。此外,模型共享的方法能够赋予SUM-ASTE一个良好的模型初始化参数,有助于模型训练学习。本文通过实验证明使用迁移学习增强的SUM-ASTE模型在各项评价指标上都取得了更好的效果。