论文部分内容阅读
近几年来,以互联网为代表的计算机信息技术迅速普及,传统商业数据已逐渐向网络积累。网络商品交易的数据能通过数据挖掘的方式合理利用并为企业决策和战略发展服务。数据挖掘在客户关系管理与产品设计中的应用是数据挖掘目前最为广泛,也是众多成功的商业应用之一。作为一种结合了数据挖掘分析技术和信息管理的新型营销方式,数据挖掘与商务智能通过搜集消费者在网络上购买商品过程的大量数据,利用关联规则、机器学习和统计分析等技术对其进行处理,根据分析结果来确定相应产品的反馈信息以及用户对某产品的观点的变化,提高产品在市场上的反应能力。
把存在于互联网上商品交易的海量数据转换成能被识别且能直接使用的知识,利用和改进商业数据的文本挖掘过程,有效的设计出针对商品评论的数据挖掘系统并以此得到准确的数据分析结果,成为了电子商务发展的迫切需要与商业信息管理的研究重点。
本文主要以商业领域的需求为背景,建立一个基于观点挖掘的网络产品评论分析系统。该系统主要分析网站上用户对某产品的观点评论文本,利用机器学习的方式主动识别用户在特定时间段内对产品相关属性的喜好程度,自动归纳出商品评论在正负两种情感表达下各自涉及到的产品属性,得到产品待宣传和改进的属性,最终以视图的方式呈现给企业管理人员,帮助他们了解市场需求,制定商业决策。
本系统采用机器学习(非线性可分类支持向量机)为理论指导,对评论文本的情感倾向进行分类,并在分类基础上对产品属性进行归纳,实验结果证明利用RBF核函数的支持向量机在该系统中有较准确的分类结果,归纳完成的属性特征也基本符合实际状况。