基于Emoji标签情感的实体情感计算与推理

来源 :上海大学 | 被引量 : 0次 | 上传用户:libolb666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界,互联网的开放性和普及性加速了热点事件的传播,热点事件的频发性和新颖性促进了互联网空间的热度。当地理空间中的热点事件被互联网报道后,以参与门槛低、简短性、实时性、互动性等优势见长的社交媒体空间产生大量关于热点事件的讨论,形成以地理空间—互联网空间—社交媒体空间为一体的热点事件全面概览。其中,社交媒体如微博、Twitter、Facebook等,因其广大的用户群体成为讨论热点事件最为活跃的空间。大家通过发表社交文本来表达对热点事件的意见、看法,因此社交文本包含了广大用户对热点事件的丰富情感。为了把握大众情绪,给处理热点事件提供决策指导,以社交文本为基础的热点事件情感分析已经成为一个热门研究领域。然而,目前的社交文本情感分析方法存在以下问题:(1)随着Emoji(例如(?),(?))的流行,越来越多的研究者开始使用Emoji进行情感分析。但是到目前为止,很少有情感分析工作对Emoji的情感进行定量地度量;(2)实体是情感的承受者,当前方法主要通过词汇进行实体情感计算,很少通过Emoji以及词汇模式进行实体情感分析;(3)热点事件中的实体不是孤立存在的,少有方法通过实体关系进行实体情感推理来计算实体情感;针对上述三个问题,本文提出三种方法加以解决。(1)通过改进的标签传播算法—标签衰减传播模型实现Emoji六维情感自动地、定量地计算;(2)构造实体—词汇及词汇模式—Emoji及Emoji模式三层网络,并基于三层网络提出情感动态增强抑制算法实现实体情感计算;(3)通过实体间等同关系和实体动词二部有向网络进行实体情感推理;本文具体研究内容如下:1.基于社交媒体中Emoji之间的共现关系,我们构建标签链接网络(Emoji Link Network)来对社交媒体中海量多样、稀疏混乱的Emoji进行组织。社交媒体中某些Emoji可以在多种语境下使用,从而导致Emoji具有情感不确定性,为此,我们提出一种基于PAD三维情感模型的Emoji情感不确定性度量方法,以度量Emoji的情感不确定性。综合标签链接网络和Emoji的情感不确定性,我们提出一种改进的标签传播算法—标签衰减传播模型(Label Attenuation Propagation Model)来自动地、定量地计算Emoji的{Love,Joy,Anger,Sad,Fear,Surprise}六维情感。具有情感不确定性的Emoji会给基于Emoji的社交文本情感分析引入大量噪音,为了确定Emoji的情感,我们挖掘社交文本中Emoji组合,以获得情感较为确定的Emoji模式,并对Emoji模式进行了情感计算。2.基于社交文本中Emoji及其模式与词汇及其模式的共现关系,我们使用Emoji及其模式来对社交文本中的词汇及其模式进行情感表示。基于社交文本的成分句法分析结果,我们计算实体与词汇及其模式的距离,从而使用词汇及其模式来对实体进行情感表示。综合上述步骤,我们构建实体—词汇及词汇模式—Emoji及Emoji模式三层网络,以对实体情感进行丰富表达。基于该三层网络,我们提出情感动态增强抑制算法来计算实体情感。3.为了解决事件中部分实体情感缺失的问题,在一些实体情感已知的情况下,我们分别提出基于等同关系和实体动词间施事受事关系的实体情感推理方法,用已知情感实体推断未知情感实体的情感,从而得到更多实体的情感。本论文的研究成果可以为政府决策和企业改进产品提供指导。政府通过情感分析了解民意,从而做出顺应民情的决策。企业通过分析用户对产品评价,掌握产品优劣,从而不断完善产品。
其他文献
“今年要加大食品安全重点整治力度,重典治乱必须重拳出击。”中共中央政治局常委、国务院副总理、国务院食品安全委员会主任李克强出席省部级领导干部加强食品安全监管专题研
社会工作是一门强调应用实践的学科,针对目前社会工作专业教育与行业发展的衔接问题,根据学校服务地方社会经济发展的办学定位和应用型人才培养的改革思路,确定了与行业伙伴,