基于情感词典的用户生成内容个性化情感分析

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:JK0803zhushuangyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们生活习惯的改变以及5G等先进技术的出现,线上操作不断占据着人们的日常生活。由于购物方式的巨大改变,网购已成为消费者进行购买活动的主要途径,针对电子商务平台进行分析的研究非常多。首先,现有基于情感词典的用户生成内容情感分析方法中,大多聚焦于情感词,忽视文本前后关联,尤其是情感词的修饰成分对文本情感色彩的影响;其次,用户做出消费决策通常基于商品描述、商品评分、在线评论等用户生成内容,但由于信息的不对称性,用户在接受这些信息时,无法判断信息的真实性,因此,用户生成内容的主体识别工作尤为必要。最后,目前针对商品评论的情感分析研究中,通常仅关注评论文本本身,而忽视了评论主体的个性化特征。基于以上问题,本文提出以下解决思路:首先,针对单条文本型用户生成内容,提出基于情感词典的情感极值计算方法。与传统的粗粒度情感分析相比,加入了中文依存语法分析,同时对现有词典进行整理扩充,使得中文文本情感分析更加细粒度化,为接下来主体的情感表达强度计算、商品评论的情感偏好计算奠定基础。其次,站在用户的角度,将目标用户的历史评论作为研究对象。从四个特征出发,构建评论文本表示向量,提出基于聚类的用户生成内容主体识别模型,实现了真实用户与虚假用户的区分。通过用户生成内容主体识别模型对虚假用户进行剔除,减轻虚假用户经常发布不实信息所带来的用户生成内容价值密度低这一不足,保证数据的真实性。最后,站在商品评价的角度,以目标商品的全部评论作为研究对象。考虑评论主体情感表达习惯的不同,构建商品评论的个性化情感分析模型,消除用户情感表达习惯不同所带来的歧义问题,得到用户对目标商品的情感偏好。分时段整理情感偏好得分,绘制目标商品的动态情感曲线,使商品情感分析结果更加直观,有利于为其他潜在用户提供参考。本文的创新点包含:(1)在HowNet词典的基础上对中文情感词语进行增添,从情感倾向偏离的方向和程度两个角度出发,提出基于依存句法的句子评论情感词典极性计算方法(QCNSP),此方法可对文本型UGC中包含的情感进行准确量化。(2)针对目标用户的历史评论,提取用户评论中包含的评价时间、评价长度、情感表达强度和语言习惯因素,构造维度为20的UGC特征向量,提出基于聚类的用户生成内容主体识别模型,以聚类结果的类间距离判断标准,实现真假主体的识别。(3)考虑到线上环境中,不同用户具有不同的情感表达,同样的UGC对于不用的用户来说,蕴含的情感色彩是不同的。因此,以目标商品的评价为研究目标,进行商品评论进行情感分析时,考虑评论主体情感表达习惯。通过结合用户情感均值对评论文本情感分析的影响,获取用户对商品的情感偏好值,使情感分析结果更加客观真实。
其他文献
[目的]为了提高杏鲍菇及杏鲍菇蛋白在加工过程中的功能特性,需要对杏鲍菇蛋白质在加工中功能特性的变化进行深入研究。因此,本试验主要研究不同处理对杏鲍菇蛋白质结构表征和
分析了单量子阱(SQW)、多量子阱(MQW)和分别限制异质结构量子阱(SCH-SQW)半导体激光器的阈值。求出了表示光增益随注入载流子密度变化的方程。利用这个结果,得到了上述三种量子阱半导
创新是企业发展的动力,也是国家经济增长的源泉。“十三五”期间,我国在新兴科技领域对产业结构进行了大量的优化与整合,意图通过调整产业的竞争结构,为企业创造良好的经济生态,从而促进科技创新,因此产业竞争度对于企业创新的影响是一个重要而有意义的话题。自熊彼特提出创新理论以来,市场竞争度对企业创新活动的影响成为了众多学者关注的话题,然而,经过半个多世纪的讨论,学术界依旧没有对该问题形成一致性的答案。为了在
本研究根据多年来对乒乓球技战术定量分析的理论研究成果,在参考传统三段指标评估法的基础上,结合削球打法自身在塑料球40+时代下呈现出的打法特征和规律,构建一套专门评估削