突发事件微博舆情的话题发现和热度预测研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:caculate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国信息技术的迅猛发展,微博成为突发事件舆情传播的重要载体,它在突发事件舆情传播中发挥着信息协同传播作用,极大影响了舆情的传播速度和规模。突发事件微博舆情具有无先兆性、无相关性和偶发性特点,舆情爆发后的管理措施在时间和空间上具有滞后性,政府在微博舆情治理中面临挑战。因此,利用海量微博数据及时发现突发事件微博舆情的话题并进行热度预测具有重要的研究价值和意义。  本文以突发事件微博舆情为研究对象,以话题发现和热度预测为研究内容。在总结国内外研究现状、梳理相关理论的基础上,分析了微博舆情传播时间、微博内容、用户参与度和用户关注度因素对突发事件微博舆情的影响,分析并选取了突发事件微博舆情数据属性。在此基础上提出了突发事件微博舆情话题发现模型和话题热度预测模型。在突发事件微博舆情话题发现中提出了K-means-sLDA模型,使用K-means算法对微博文本聚类,基于轮廓系数法和聚类组内平方和法寻找微博文本的最优聚类数K,同时将聚类结果用于微博文本的无标签变量到有标签变量的转化。将K作为sLDA模型的主题数量,对转化后有标签变量的文本使用sLDA模型进行隐含主题提取,从而发现突发事件微博舆情话题。在突发事件微博舆情话题热度预测中提出了改进粒子群和Elman神经网络模型,将突发事件微博舆情话题热度影响因子作为模型输入变量,以发帖量衡量突发事件微博舆情话题热度并作为模型输出变量,构建突发事件微博舆情话题热度预测模型。针对Elman神经网络模型易陷入局部最优的缺点和粒子群算法全局和局部寻优能力弱的缺点,将改进权值粒子群算法用于优化Elman神经网络的初始输入权值和阈值,构建基于改进粒子群和Elman神经网络的突发事件微博舆情话题热度预测模型,使用训练集对模型进行训练,以预测集进行话题热度预测。  通过对比实验验证了本文提出的突发事件微博舆情话题发现和热度预测模型的有效性。微博舆情话题发现方法解决了sLDA模型主题数的确定和微博文本无标签变量的问题,在微博舆情的话题发现中话题识别准确率高;微博舆情话题热度预测方法解决了Elman神经网络在微博舆情话题热度预测中易陷入局部最优的问题,将微博舆情话题热度影响因子加入模型也提高了微博舆情话题热度预测的准确度。
其他文献
Since the wind wave model Simulating Waves Nearshore(SWAN) cannot effectively simulate the wave fields near the lateral boundaries, the change characteristics a
台湾自1953年订定「公营事业移转民营条例」推动公营企业改革政策至今,历时54年之久,在这超过半世纪的实施历程中,共有17家公营企业结束营业,超过50家公营移转民营或裁并,至2007年
由于政府创投和创投网络在世界各国创业投资中的普遍性,二者一直是创投学术研究的热点领域,涌现出许多重要研究成果。然而,除了两份定性调查报告之外,很少有文献注意到这两个领域
在以客户需求为导向的今天,退货、产品回流已经司空见惯。在制造企业,回流的产品规模较大,造成了严重的资源浪费。逆向物流的库存控制的理论研究在这些企业中有着重要的现实意义
本文通过对荣华二采区10
水稻在成熟期遇高温,气侯干燥,种子外部迅速收缩,而内部水分还来不及向外移动,仍然保持紧张状态,使外部种皮和颖壳承受一定的压力。一旦超过它们的承受度,将会发生颖亮开裂
育种是很重要的开发生产力的途径,而且取之不尽,用之不竭。单产水平越高,育种在增产中相对贡献越大。据资料介绍,近几十年,国外粮食产量的增加,70%来自单产的提高。诸增产因
在工程项目施工过程中,工期是三大控制中重要的控制项目之一。工程建设项目进度管理工作的执行情况不仅直接影响到项目的按期交付使用,而且关系到其综合经济效益能否顺利实现
样板田能够出科学,而且科学成果出的快、出的好。因为样板田上有丰富的群众生产经验,是农业科学研究取之不尽的源泉。这是我参加样板田工作一条深刻的体会。 Model field t
空间决策支持系统(SDSS)是决策支持系统与地理信息系统(GIS)技术相结合的产物。SDSS在解决半结构化和非结构化问题中具有较多优势,并且已经在许多决策问题中取得很好的应用效果。