互联网新闻评论影响力的分析与评价对象抽取

来源 :北京大学 | 被引量 : 0次 | 上传用户:long671
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的发展,用户越来越注重在互联网上交流和反馈,于是大量的评论和评价信息随之出现。这些用户生成内容,一方面可以提高读者体验,另一方面又可以用来追踪事件发展和社会态度,因此对用户评论的分析,尤其是情感分析,也越来越受到工业界和学术界的重视。本文针对一种特定的评论形式—新闻评论,研究了两个重要的问题:评论影响力分析和评论中评价对象的抽取。   评论影响力分析是评论研究中的一个新课题,不同于传统的评论有用度分析,它更注重评论之间的关系。本文通过探讨新闻评论的内部结构,利用主题之间的关系建立一个全新的主题模型。这个模型不仅能够预测评论的总体影响力,还能对每个主题进行分析,获取主题信息以及在这个主题下的影响力。我们下载了搜狐新闻中20篇新闻下共11307条评论,以实际的用户评分作为标准,实验结果表明我们的模型表现优于传统的回归模型。   评价对象抽取则是属于细粒度情感分析的一个重要课题,但是目前的研究局限在新闻正文和产品评论等领域,没有涉及新闻评论这一特殊但很重要的领域。由于格式的不规范以及隐式对象的存在,新闻评论的评价对象抽取难度要远大于其他领域。考虑新闻评论的特性,我们利用新闻正文的信息以及相邻评论之间的语义连贯性等信息,提出了一个基于中心理论的评价对象抽取模型。我们基于国内重要门户网站一新浪网新闻评论人工标注了1597条评论句子,实验证明我们的模型在新闻评论中是有效的。
其他文献
媒介在人类文明的发展过程中起到了至关重要的作用,是推动文化传播的重要因素,每一种新的媒介都是一个巨大的飞跃。随着计算机科学技术与网络技术的发展,数字网络传播逐渐成
无线视频传感网在传统的以传感器网络为基础的环境监测活动中引入了图像、视频等媒体,信息含量丰富,为实现细粒度、多维度、更全面的环境信息感知提供了数据支持。它关注于视
无线传感器网络越来越多地被运用到环境监测、公共医疗、军事等领域,于此同时,学术界关于物联网的研究也越来越广泛和深入。网络经常被部署在无人值守的恶劣环境中或者敌对环
随着进化算法在多目标优化问题的成功应用,逐步发展成为一个新的研究方向,引起了众多研究学者的重视,成为学术界研究的热点。特别是在过去十年中,众多国内外学者的关注和研究
聚类分析作为数据挖掘的主要方法之一,越来越引起人们的重视。所谓聚类是将一组对象分成若干类,使得同一类内的对象尽量相似,不同类的对象尽量相异。由于聚类在现实生活中应
随着互联网的高速发展,语义网数据的规模也在呈现爆炸式增长。当语义网数据规模达到一定程度时,传统的单机管理模式就无法适用了,在存储和查询的时候,单机的硬件条件必然会成
近几年,随着社会的发展,公共安全已经越来越受到社会的关注和国家的重视。其中公共安全中一个重要的控制因素就是客流量,利用统计的客流量信息,管理人员可以合理的调度人力、
作为构件的运行支撑平台(Component Operating Platform),应用服务器为网络应用的开发、部署与运行提供了全方位的支持,同时通过凝练和提取一系列公共服务支持复用,降低应用开发
汉语是典型的意合型语言,其研究的困难程度举世公认。相对于现代汉语而言,历时性是古汉语的突出特点。这种历时性加剧了数据不同分布和稀疏问题,使得古汉语信息处理研究进展缓慢
WAP技术的发展使手持设备也可方便地访问网络资源,但单独为这些设备开发适合其访问的网页需要投入多余的资源,开发出的网页也因为设备多样性的问题难以适应所有设备的显示。面