基于翻译模型的网络评论情感分析研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:kk831013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的普及与发展,大部分网络消费者在购买商品前都会浏览商品的用户评论信息,这些评论信息不仅对消费者做购买决策有帮助,对生产厂家或电商公司获取商品市场反馈也有重要贡献。然而,从海量的商品评论中获取对用户有用的信息是一件很繁琐的事情,因此情感分析(Sentiment Analysis/Opinion Mining)应运而生。情感分析的主要工作就是挖掘并分析文本信息,实现相应的情感分类或情感极性判定。情感分析不仅在商品评论分析领域得到了广泛的应用,在网络舆情分析,金融股市分析和垃圾邮件处理等方面也有较高的研究价值。情感分析在自然语言处理,信息检索,数据挖掘以及机器学习等领域都有涉及,因此,研究情感分析的方法也比较全面。情感分析的主要内容分为两部分:倾向性信息识别和倾向性信息分类,在众多的研究方法中提高识别精度和分类精度一直是情感分析研究的重点。按分析的粒度的可以把情感分析分为篇章级别、句子级别、短语级别和词语级别。早期的情感分析主要集中在篇章级别和句子级别,随着用户提出的要求变高,短语级别和词语级别这种细粒度的情感分析逐渐成为了当前的研究热点。本文主要是对网络产品评论进行词语级别的情感分析研究,主要内容:1.研究了抓取网页数据的方法,并对数据进行了分词、词性标注和去噪声。2.研究识别情感词和评价对象词语的方法。情感分析中识别情感词和评价对象的精度一直是研究的重点,因此本文充分利用情感关系和词语本身的特性就如何有效地识别情感词和评价对象进行了详细的研究。除此之外,还实现了另外两种方法作为本文的对比实验,针对不同的抽取方法进行了详细分析。3.研究了情感词的情感倾向分析方法。把情感词的情感极性分为正面、中性和负面三个类别。首先分别用超限学习机、支持向量机和Softmax回归进行实验,然后选出分类结果做好的分类器。
其他文献
随着计算机、互联网以及存储技术等高新技术的发展,数字图像的传播及存储数量正在以惊人的速度增长。因此人们需要更加快速、准确的图像检索方法来查询所需要的图像及相关信
近年来,随着我国高等教育的快速发展,高校办学规模不断扩大,教学资源日益紧缺,使教务管理部门任务越来越重,不仅增大了工作量,更增加了工作难度,管理稍不到位,便容易出现失误。为了改
网格的出现,使得在地理上广泛分布的各种资源在逻辑上形成一个整体,从而实现资源共享和协同工作。另一方面,随着传感器,存储系统,网络处理能力和容量的显著提高,使得创建海量
本科教学工作水平评估是教育部为进一步加强国家对高等院校教学工作的管理与指导而进行的认证。教育部确立了对普通高等院校进行五年一轮的评估制度,实践表明,开展此项工作,对规
本文主要讨论高维空间球集最小球覆盖问题和二维空间圆集最小圆覆盖问题。高维空间最小球覆盖问题是指对于给定的高维空间球集S,求解覆盖S中所有球的最小球。二维空间最小圆
工作流是业务流程的计算机化或自动化。工作流管理系统是一个软件系统,它完成工作流的定义和管理,并依据在系统中预先定义好的工作流逻辑进行实例的执行。工作流技术要解决的
汉语属于分析性语言,缺乏严格意义上的形态变化,汉语的副词承担着繁重的语法任务,在汉语语法系统中具有重要地位。副词在自然语言理解与生成中的重要性不言而喻。目前已有的
容错编码技术是针对数据传输与存储系统所面临的容错信道,保证数据高效、可靠传输与存储的一种前向纠错编码技术.随着P2P网络、多播传输等技术的发展,基于数据块或数据包的大
从生物序列中识别基序是生物信息学中的一个热点问题,也是生物学中研究基因调控机制的基础计算问题之一。由于基序长度较短、非百分百保守以及生物数据复杂性高等原因,通过计
边缘检测技术是图像分析的重要内容,也是图像处理领域中一种重要的预处理技术,受到了人们广泛的关注和重视。由于实际应用中图像质量的优劣性和目标的复杂性,进行边缘检测时