【摘 要】
:
近年来,随着互联网的广泛应用和网络技术的快速发展,越来越多的用户开始在互联网上发表自己的观点和看法。这些信息文本的长度通常都比较短,且文本语法结构不规范,但是这些海量的短文本中包含了用户丰富的情感倾向,体现了人们对各种事物的需求与看法。对这些信息进行分析,挖掘出其中蕴含的用户情感,可以给国家政府和企业了解社会舆情提供重要的参考信息,具有重要的研究价值。本文主要探索深度学习技术在短文本情感分析领域的
论文部分内容阅读
近年来,随着互联网的广泛应用和网络技术的快速发展,越来越多的用户开始在互联网上发表自己的观点和看法。这些信息文本的长度通常都比较短,且文本语法结构不规范,但是这些海量的短文本中包含了用户丰富的情感倾向,体现了人们对各种事物的需求与看法。对这些信息进行分析,挖掘出其中蕴含的用户情感,可以给国家政府和企业了解社会舆情提供重要的参考信息,具有重要的研究价值。本文主要探索深度学习技术在短文本情感分析领域的应用与创新,提升深度学习模型在短文本情感分析中的准确性。首先,针对卷积神经网络(Convolutional Neural Network,CNN)在分类情感特征时使用的全连接层会破坏情感特征的空间结构信息,本文使用无全连接层的卷积神经网络结合支持向量机(Support Vector Machine,SVM)模型提出了 CNN-SVM模型。为了提升单分类器的性能,本文在CNN-SVM模型的基础上结合Bagging集成学习方法提出了 Multi-CNN-SVM模型。其次,由于卷积神经网络提取的情感特征缺少一定的上下文联系,而且文本语句中不同词语对文本情感的影响程度不同,本文使用能提取文本上下文关系的双向门控循环单元(Bidirectional Gated Recurrent Unit,BiRGU)网络结合注意力机制(Attention Mechanism)提出了 Attention-BiGRU模型。再次,针对数据样本不足的情况,本文使用小样本学习(Few-Shot Learning,FSL)方法结合注意力模型和孪生网络提出了 Attention-Siamese 模型。最后,本文分别对上述模型在当当图书评论数据集和Amazon的多领域情感分类数据集上进行实验验证。实验结果表明,本文提出的三个模型在短文本情感分析领域均获得了更好的准确率和F1值。
其他文献
河北是一个文化大省,非物质文化遗产遍地开花,这些文化与河北当地人民的生活息息相关,反映了他们的生活习惯和精神面貌。目前河北省大部分非物质文化遗产只有汉语资料,有些非物质文化遗产项目虽附加了英文介绍,内容却过于生硬,不利于目的语读者的理解,因此对非物质文化遗产文本的翻译仍有较大的探索空间。本次实践选取《河北省非物质文化遗产图典》中17项具有代表性的文化遗产进行翻译,在维索尔伦的顺应论的指导下,结合翻
随着全球变暖和污染问题的日益加剧,人类发展的道路上又同样面临着能源枯竭的严峻挑战,太阳能作为一种清洁的可再生能源得到了广泛的重视和研究。这种电池以有机-无机杂化钙
目的:探讨血浆硒水平与脂肪肝(Fatty Liver Disease,FLD)、非酒精性脂肪肝(Nonalcoholic Fatty Liver Disease,NAFLD)的关联性,为FLD、NAFLD的防治提供新依据。方法:本研究基
随着世界范围内能源短缺和环境污染问题的加剧,可再生能源的开发和利用成为研究的热点。由此光伏发电产业迅速发展,光伏发电并网成为太阳能利用的主要形式之一。光伏并网逆变器作为光伏发电并网系统的核心,其性能直接影响到系统的稳定性和输出的电能质量。本文为了提高并网逆变器的性能,对光伏并网逆变器的控制策略进行研究,具体研究内容如下:1)建立LCL型并网逆变器在abc、αβ、dq坐标系下的数学模型,并推导dq坐
随着民用无人机越来越普及地运用于社会各个领域,其导致的各类侵权后果层出不穷,给民众安全造成重大隐患,民用无人机第三者责任险应运而生。民用无人机第三者责任险,是指以被保险人在操作无人机过程中对他人造成的人身、财产或其他损失而应承担的民事经济赔偿责任和经过特别约定的合同责任作为保险标的的责任保险。目前许多欧美国家都在逐步推出无人机三者险,瑞典甚至通过立法对其地位给予明确肯定,然目前我国只有众安在线等极
中小企业作为我国经济体系中最活跃、最具创新精神的微观主体,生命力越来越蓬勃向上。但规模较小、发展尚不健全、资金成本高、融资难、融资贵等问题一直制约着中小企业的发展。2004年5月17日,中国证监会同意深交所设立中小企业板块,其宗旨就是为了让具有成长性的、主业突出的中小企业提供直接融资的平台。但很多企业在募集资金后,并没有给投资者带来预期的收益,甚至让投资者蒙受损失。因此,募集资金使用效率的问题便愈
能源作为人类生活和发展的必须物质,对能源的产量做出合理的预测是必不可少的。生活能源主要以消耗石油和天然气为主,石油产量的多少与国民经济的发展有着直接的联系,石油的产量相当于国民经济的血液。石油作为一种不可再生的能源,对石油产量做出合理的规划和使用是势在必行的。对于石油产量做出合理预测,对指导石油人员的分配,以及石油的规划使用具有重要的意义。针对传统的石油产量预测方法,本文基于深度学习的方法对石油产
硬件木马是可以在集成电路设计制造的任意环节中被植入的,能够在特定的条件下激活的恶意冗余电路。硬件木马可以修改原始电路的功能,窃取电路的密钥信息甚至使芯片失效。由于
第一章苯丙烯类天然产物的神经保护作用研究目的:检测苯丙烯类天然产物对NaN3诱导的PC12细胞损伤的保护作用,挑选出保护作用最显著的反式-茴香脑;初步探索反式-茴香脑对NaN3
背景与目的:肝硬化发展至门静脉高压时,其发生的一个重要病理、生理改变就是门静脉-体循环侧支的开放,而其中主要的侧支循环就是食管周围静脉丛的曲张。曲张的食道静脉常能发