基于知识嵌入的情感分类研究

来源 :中国计量大学 | 被引量 : 1次 | 上传用户:scetc203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务、社交平台的兴起,网上的评论文本急剧膨胀。如何自动分析这些海量的评论文本信息,是自然语言处理领域的一大挑战。情感分类是分析这些主观性文本信息的有力手段。情感分类在商业决策、信息检索、信息安全等方面有着重要的应用价值。相对于普通的特征项来说,情感知识具有强烈的情感色彩。嵌入知识可以充分利用中文文本所含的情感因素,在一定程度上简化分类模型的构建。结合知识嵌入的思想,本文对中文文本情感分类中特征的有效表达、分类器的构建等进行了研究,主要研究内容及创新点有:1.提出了一种基于知识嵌入的特征权重计算方法。在中文文本情感分类中,传统的特征表达通常忽略了语言知识的重要性。通过构造一种特征嵌入模式将词性或情感词对情感分类的贡献度嵌入到传统的TF-IDF(term frequency-inverse document frequency)权值中。其中,情感贡献度通过粒子群优化算法获得。最后,采用支持向量机完成分类。实验中,对比了不同知识的嵌入情况,包括词性、情感词及词性和情感词的组合。实验结果表明基于词性嵌入的方法分类性能最优,可以显著提高中文文本情感分类的准确率。2.提出了一种基于词性嵌入的核超限学习机中文文本情感分类。针对传统情感分类算法存在的参数学习困难、分类性能较低等问题,考虑将核超限学习机应用于情感分类。通过信息增益对训练数据进行特征选择以降低输入维数,并构建基于小波核超限学习机的分类器实现对中文文本的情感分类。实验结果表明基于核超限学习机的情感分类方法参数学习容易,且其文本情感分类性能通常优于支持向量机和朴素贝叶斯。之后,将词性嵌入方法和核超限学习机结合起来实现情感分类。实验结果表明,增加词性嵌入方法进一步提高了核超限学习机的分类性能。
其他文献
在商业广告狂轰滥炸的时代,消费者更倾向于相信用户口碑,并根据购物平台上的商品评价和社交软件上的讨论内容作出购买决策。意识到口碑的重大价值,企业主动通过推送邀评消息、好评返现、积分兑换等多种手段引导消费者发布口碑信息。另外,部分企业通过邀请消费者参与新产品创意大赛、个性化产品定制、产品改进意见收集等方式的口碑营销,发现也能够促使创新顾客向亲朋好友或陌生人推荐企业/品牌/产品/服务。同时,学术界根据实
随着计算机技术的急速发展,各类应用对网络传输质量提出了更高的要求,传统网络“尽力而为”的传输模式已经无法高质量地满足各类应用,特别是实时应用的传输要求。具体地,网络中业务流种类繁杂、传输流量特征各不相同、对网络传输的需求不同,传统的端到端拥塞控制算法对网络感知能力有限,容易造成网络拥塞而增大了网络流的时延,同时其也容易因为错误的判断而降低发送速率导致网络利用率低。软件定义网络(Software D
迁移学习与传统机器学习方法相比较,主要的优点在于,学习目标任务时利用了目标领域之外的其他领域的知识,无需满足训练数据与测试数据符合同一分布这一要求。随着移动电子产
氧化三甲胺(TMAO)是鱼体中的一种天然组分,是鱼的天然鲜味成分。TMAO会在鱼体死亡后转变为三甲胺(TMA)、二甲胺(DMA)等挥发胺,这些物质是鱼体中标志性的腐败成分。传统的鱼类品
随着短距离无线通信技术的发展和智能移动设备的广泛普及,邻近移动社交网络(Mobile Social Network in Proximity,MSNP)服务备受人们青睐。MSNP是一种移动端到端(Mobile Peer
汽车在给人类带来便利的同时,也给社会带来了能源问题和污染问题,降低汽车的排放污染迫在眉睫。混合动力汽车可以继承传统汽车续航里程大的优点,还可以发扬电动车零排放的优
公路是国民经济的重要组成部分,是构筑社会经济的主要力量。公路运输对于刚果(布)经济的发展起着至关重要的作用。公路线形一旦确定就很难做出改变,并且公路的线形还决定着汽车行驶安全以及车辆通行质量的高低。建成之后,公路的经济价值、舒适性、安全水平取决于公路在设计阶段线形设计的优劣。公路的运行质量和交通安全取决于设计过程中路线指标参数的选择以及设计方法。在设计公路时,不仅要对公路的建设条件作出充分的考虑,
随着社会经济的迅速发展,我国机动车数量不断增长,导致交通问题日益严重,实施有效的交通监控对于解决日益增长的交通问题具有积极意义。然而,目前大多数的交通监控系统存在系
视觉感知为人类提供了关于周围环境丰富而复杂的信息集,人们非常依赖视觉输入来执行许多重要功能,失去视觉将会给人们带来许多不便和危险。根据世界卫生组织(WHO)针对全世界视障人群所作的调查统计,截至2010年,中国盲人数量已经达到824.8万,并且低视力人数高达6727.4万,是全世界视障人数最多的国家。现有的一些助盲工具为盲人的日常生活提供了一定的帮助,但价格昂贵、交互不好、体验差、安全系数低等问题
视频目标再识别的主要任务是在未知视频数据中,再识别已标记的运动目标。本文首先综述视频目标再识别问题的算法框架,并从场景变化、目标个数两个方面分别阐述目标再识别的重