基于软件评论的细粒度功能情感分类设计与实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:wsh2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着目前互联网行业的快速发展,人们对软件产品的需求日益增多。在这样的背景下涌现出了大量的软件下载平台,在这些平台上人们不仅可以下载软件,以及针对某个软件发表看法来表达对这个软件的喜好程度。同时,用户还可以通过阅读软件产品的历史评论来了解软件的特点,为用户在下载软件时提供决策支持。而对于软件开发商来说,他们可以通过这些评论及时的得到反馈,获取改进意见,从而开发出更加符合用户需求的软件产品。然而,软件评论数量随时间成几何趋势增长,无论是用户还是开发方都需要花费大量的时间从海量的评论数据中甄别出有用的信息。面对这种问题,利用情感分析技术对软件评论进行深度挖掘具有很强的实用价值。目前对软件评论的情感分析主要是基于情感字典的匹配来进行情感分类,由于软件领域中文本评论的特殊性以及情感字典的匹配模式不具通用性的问题。另外,对软件评论进行情感分析不能仅停留在篇章级和语句级层面,还要从软件评论中挖掘出软件功能的情感倾向。因此如何针对软件评论的特殊性进行情感分析是值得研究的。针对上述问题,本文主要从以下几个方面进行研究。1、分析软件领域的评论数据,基于情感词典匹配模式辅助人工标记,构建评论情感分析语料库,为中文软件领域进行机器学习提供了大数据集基础。2、爬取软件下载平台上的软件评论数据,对其进行文本预处理,然后利用多种特征选择方式和有监督机器学习分类算法对软件评论进行情感分析,研究了不同特征选择方法和分类算法对情感分类效果的影响,综合特征选择方式和分类算法的影响因素,优化情感分类效果,为探索软件产品评论情感挖掘模式提供了情感倾向的判断基础。3、设计对软件评论实体信息的实体抽取规则,探索了针对软件细粒度功能的情感倾向分析模式。将软件功能词和评价词抽取出来,并与软件评论的情感分类结果进行映射,从词的层面对软件评论情感进行细粒度的情感分类,实现软件特征、描述、极性三个维度模型的构建。从而获取更精细的情感分析效果。
其他文献
目的:探讨应用二维斑点追踪显像(two-dimensional speckle tracking imaging,2D-STI)的自动功能成像(AFI)技术评判病毒性心肌炎患者左室心肌力学特性改变的诊断价值。方法:选
这篇硕士学位论文利用无穷维动力系统理论和算子半群理论,分别研究了带有时滞的非自治吊桥方程,带线性记忆的阻尼耦合吊桥方程对应动力系统的长时间行为.第一部分,讨论带有时
本学位论文运用Rabinowitz全局分歧定理,研究一维给定平均曲率问题正解的存在性及解集的全局结构;运用Leary-Shauder不动点定理研究高维平均曲率问题径向正解的存在性.主要工
在连铸过程中,结晶器内钢液表面的稳定程度是决定铸坯质量的重要因素。在电磁连铸过程中,交变磁场产生的电磁力也会引起液面的波动,因而如何对液面的波动和变形行为进行电磁
目前,国内外建筑都遵循“小震不坏,中震可修,大震不倒”的设防目标,然而,在大震过后,大部分建筑必须拆除重建,会给城市快速恢复和重建带来巨大负担。本文旨在研究一种C形高强
真光层颗粒有机碳(POC,Particulate Organic Carbon)的输出通量反映了海区对大气CO2的吸收能力,因此常被用于评估海洋固碳能力。西北太平洋海域作为一个人为CO2重要的汇,吸引
本课题是设计和实现星载雷达监测系统仿真平台。星载雷达是最近几年雷达研究领域的热点话题,原因一是它克服了地面雷达,舰载雷达等的诸多缺点,具有全球范围、全时段的战场监
作为国内刊行量第一位的新闻纪实类刊物,《知音》既没有精美的封面以及精致的纸张,也完全不同于那些以思想性、知识性为主的期刊杂志,而是以情感类题材作为故事内容的主要来
食品安全是关系国计民生的重大民生问题,关系到社会的和谐稳定。利用信息追溯系统检测食品在种植过程中的安全性,这是农产品检验领域亟待解决的关键问题之一。本研究以山西阳
由于工业化进程的加快,控制工业生产排放的微细颗粒物也越来越受到人们的广泛关注。所在课题组开发了一套针对PM2.5-PM10的新型电磁精细除尘系统。该系统通过外加行进磁场驱