论文部分内容阅读
突发事件发生时,通常相关话题都会在网络上散布,如通过微博平台等。因为突发事件的突发性、不确定性、信息有限性,错误、片面、过激的舆论会引起人们的恐慌行为破坏社会稳定给广大人民带来物质和精神损失。因此微博网络测量和话题趋势预测在网络舆情分析与预警等方面具有十分重要的应用价值。本文通过研究突发事件下新浪微博网络测量,旨在分析微博网络话题的形成、传播和发展特征。网络测量研究内容包括对国内最具规模的新浪微博平台进行数据采集和分析,测量微博网络拓扑结构的指标。通过描述突发事件下新浪微博网络的拓扑结构,分析突发事件话题在新浪微博上快速传播的原因,并在此基础上建立一个突发事件发生后微博话题变化趋势的预测模型,设计并实现了一个话题趋势预测的原型系统,从而为研究舆情监控的相关问题提供参考。本文研究工作分为两个阶段,第一阶段为突发事件下微博网络测量,第二阶段为突发事件下话题趋势预测。首先使用自主研发的Java微博爬虫器爬取新浪微博与突发事件话题相关的数据。之后,通过对数据的预处理、微博网络的参数测量和计算、实验及结果分析等步骤完成突发事件下微博网络测量工作。最后,通过话题发现、预测模型建立和评估、实验、分析结果步骤完成突发事件下话题趋势预测模型的研究与实现工作。本文将突发事件下微博网络测量结果与已有的在线社会网络测量结果进行比较分析,发现突发事件的微博网络具有小世界特性,特征路径短、聚合度高等特点,并且网络中用户关系紧密,用户节点倾向于连接入度大的节点。在网络测量的基础上,本文选用隐马尔科夫模型,结合意见领袖参与状态,对突发事件下话题状态趋势进行预测,建立了相应的模型,并设计和实现了微博网络测量和话题预测的原型系统,利用实际数据对模型进行评估,最终得到的实验结果误差较小。