基于SVM的微博情感倾向性分析研究

被引量 : 0次 | 上传用户:working_man_1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的到来,网络的发展已经进入人们生活的各个领域,近年来微博的出现,让生活更加丰富。微博影响力的增长,吸引了大批学者对微博客的深入研究,而情感词识别和情感分析成为了一个重要的课题。在微博的开放平台,提供的功能是可以查阅信息,也可以发布信息给别人来看。与此同时,随着发布信息的多元化,随之产生了新问题,如,情感新词的出现及对微博句的情感极性分析,新词的出现给中文分词产生很多难以识别的“散串”和“碎片”;情感分析时判别感情倾向性微博客的文字,属于判断积极的,消极的,中立的法官。对这些文本的情感倾向性,可以对网民的情绪有掌握,不仅有一定的商业价值,还有益于社会、还可以帮助我们在舆情监控、词库更新、自然语言处理等领域完善。每天数以万计的中文微博用户刷新信息,对微博情感词的产生以及对极性分析的问题都随之产生,做好这些工作对了解用户的态度很重要和迫切。本文通过从实验提供的数据,通过条件随机场进行情感词识别,进行词性标注,结合上下文信息特征,构建特征向量,对语料数据进行训练模型构建和测试,最后得到情感词的正确率(Precision)、召回率(Recall)和F-值。对微博情感词进行有效正确的识别是判别微博文本情感倾向性的前提和基础。本文首先结合中文信息处理、自然语言等知识,结合实验室对情感新词发现和情感倾向分析的研究,论述情感倾向相关的各种关系,是建立在微博情感倾向性判断现有所做分析的基础之上的。本论文的研究最终目的是提高数据结果的正确率、召回率及F-值,为更进一步的研究奠定基础。实验数据选用项目给定的微博语料,情感词识别和情感倾向性分析的训练和测试数据是不同的,实验结果也验证了该论文中用到的方法是可行的。实验结果显示:该方法在情感词识别正确率为34.21%,召回率为0.11%,F值为0.002%;结果识别率整体不高,但也为下一步工作打好了基础。对情感句极性判别的正确率为84.87%,召回率为65.18%,F值为77.27%,此次研究对中文微博的情感倾向性分析进行了初步探索。
其他文献
梅贻琦将中国大学理念概括为“大学之道,在明明德,在新民”,使在校学生拥有光明正大的品德与弃旧图新的学习能力是大学的办学要求1。大学文化是大学精神的体现,校园媒介是大
目的:探讨富细胞型子宫平滑肌瘤鉴别中动态对比增强磁共振药代动力学模型的应用。方法:选取2016年1月-2018年1月我院收治的88例子宫平滑肌瘤患者,其中普通型38例,富细胞型22
在众多的核测井系列中,岩性密度测井仪由于能够一次性获得地层的岩性信息和密度信息而广被研究、应用。核脉冲全谱数据采集系统就是为岩性密度测井仪量身研制的,与传统基于能量
南疆喀什地区地处欧亚大陆腹地,光、热资源丰富,干旱少雨,属于典型绿洲灌溉农业,无霜期长,周年积温较高,适宜发展多熟种植。南疆是新疆粮食生产的主产区,农业先进生产技术发展相对滞
我国钢铁业面临着日益严峻的原材料与能源短缺、环境污染等问题,从可持续发展的角度出发,开发低成本、高性能、环境友好和易循环的钢铁产品成为钢铁业发展的重要方向。渗碳体
针对五坐标数控加工仿真中刀具扫描体和零件毛坯之间布尔运算量大,传统的基于空间分解的体素建模方法需要计算机内存空间大,仿真时间长,仿真精度低等问题,结合Dexel模型提出
铜铅锌多金属矿中,不同矿物往往共生紧密,嵌布粒度细,难以达到单体解离;矿浆中的难免离子会活化被抑制矿物,恶化抑制效果;加之不同矿物的可浮性交错重叠,铜铅锌矿物分离困难。
随着二十一世纪的深入发展,我国居民的生活水平不断提高,人们对于身体健康状况提高的需求也不断增加。加之全民健身运动的大发展,我国商业健身俱乐部近些年来发展迅速,而商业
第一部分人工髋关节置术换治疗内固定失败的老年股骨转子间骨折的有限元分析目的运用计算机软件模拟股骨转子间骨折DHS内固定失败后的非骨水泥型人工髋关节置换术的有限元模
本论文研究目的是对互联网运动健身服务的现状及对策的研究,旨在弄清PC互联网和移动互联网为运动健身提供的多种服务的发展状况、使用者规模和使用者行为等情况,洞悉影响互联