论文部分内容阅读
随着技术的进步,互联网对人类生活的影响不断的加强。微博、论坛、博客这类社交媒体的普及也使得越来越多的人可以通过互联网表达自己在政治、经济、商业等各个领域的想法。从《2017中国网络舆情指数年度报告》可以发现,微博已经成为了仅次于传统媒体的的第二大舆情源。微博用户主要通过评论、点赞、转发等行为参与互动。民意负面情绪激化、意见领袖过度扭曲、主流媒体引导后劲不足等行为都会对维稳工作造成影响。因为网络舆情和大数据高度契合,传统的信息处理技术并不能有效的分析大规模的舆情网络数据,如何快速准确地分析舆情网络中的价值信息显得至关重要。本论文主要设计并实现了微博舆情信息传播分析系统,目的在于清晰直观地解析和把握舆情的演化规律。该系统通过模拟登录新浪微博对微博事件的转发信息进行采集,利用可视化技术构建舆情传播网络、识别舆情扩散的关键节点和传播路径,以网络图的形式还原了微博事件扩散的过程,为相关人员提供了一个交互性良好的舆情分析工具。本论文取得的研究成果主要如下:(1)使用node.js模拟登录新浪微博,通过网络爬虫自动抓取到微博转发信息并写入数据库中,然后根据数据库中用户之间的关系构建微博舆情转发网络图并通过特定的算法来对舆情网络图中的关键节点和传播路径进行分析。(2)根据用户的活跃性值和微博舆情网络结构、链接关系构建了一个新的关键节点辨别算法ActiveRank,该算法根据新浪微博用户的微博数、关注数和粉丝数三个特征来定义用户的活跃性值,将活跃性值和社会网络中辨别关键节点的PageRank算法相结合来找出舆情网络传播过程中的意见领袖。(3)市面上对于微博转发的分析结果大多是采用图表的方式来展示,本文使用舆情网络图来直观地呈现微博的转发过程。本文采用D3.js力导向图来展示舆情传播网络,并根据舆情网络具有时序性的特点,在可视化展示时考虑了转发时间来从整体把握微博转发网络在时间上的变化。