网络热点新闻焦点识别与演化跟踪

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:ztqye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络新闻焦点识别及演化跟踪对新闻检索、新闻推荐和舆情分析等起着非常重要的作用.当前的新闻焦点识别方法存在着焦点识别不清、演化跟踪偏斜以及不能捕获焦点报道的强度分布等问题.通过深入分析新闻报道的特点及LDA(Latent Dirichlet Allocation)主题模型原理,把报道文档发布的时间信息引入LDA模型中,提出一种基于焦点和时间联合建模的新闻焦点演化跟踪方法 DST-LDA(Dynamic Subtopic and Time based Topic Model).该模型避免了以往跟踪算法严重依赖时间分割的局限性,能够产生文档-焦点θ、焦点-词汇φ及焦点-时间π三个分布矩阵,通过选择新闻焦点的特征词和特征时间,高效地分类出新闻焦点并识别出各焦点持续的时间分布及报道力度.本文在4个新闻数据集上分别对DST-LDA算法进行了实验验证,并与其它主流算法进行了对比.实验证明:本文算法在新闻焦点演化跟踪方面达到了良好效果. Focusing on network news and tracking evolvement plays a very important role in news retrieval, news recommendation and public opinion analysis etc. The current news focus recognition methods have the following problems: unclear recognition, skewness of evolution tracking and intensity distribution of inability to capture the focus report Problem.Through in-depth analysis of the characteristics of news reports and LDA (Latent Dirichlet Allocation) theme model principle, the time information released by the report documents is introduced into the LDA model, and a focus evolution tracking method DST- LDA (Dynamic Subtopic and Time based Topic Model). This model avoids the limitation that the previous tracking algorithm relies heavily on time partitioning, and can generate three distribution matrices: document-focus θ, focus-vocabulary φ and focus-time π. Focus on feature words and feature time, effectively sort out the news focus and identify the focus of the sustained time distribution and coverage.This paper tested the DST-LDA algorithm on four news data sets, and with other mainstream Algorithm is contrasted.Experimental results show that this algorithm is in the tracking of news focus evolution To good results.
其他文献
本文分析了子波变换自适应时频多尺度分辨的特点及相应的快速算法,子波变换与神经网络融合实现图像信息智能处理的技术.指出了用子波变换进行计算机网络图像信息降噪、数据压
期刊
凌晨3时03分起床后,趁着照明灯的光线,马来西亚皇家第9团的士兵像幽灵一样穿过船上狭窄的走廊。他们从军械库中提取武器后,背着重重的背包,摩肩接踵般地通过登陆艇的升降扶梯
期刊
期刊
近年来,社交网络平台中好友推荐服务成为个性化推荐研究领域的热点课题.而社交网络中网络关系结构的复杂性、网络群体的多变性以及网络信息的多源和不一致性等现象给个性化推
针对传统相型软件可靠性模型(PHSRM)无法处理软件故障分组数据,且数据拟合能力和计算效率不均衡的问题,提出基于混合Erlang分布软件可靠性模型(HErSRM)期望最大化的软件故障
主要针对悬臂式掘进机在不同的坡度条件下,整机升起过程中,对铲板部及后支撑部的撑起状态进行受力分析计算,验算其支撑能力,以此作为掘进机研发设计时部分性能参数值选取的依
随着智能手机的普及,室内定位伴随着移动互联网浪潮开始在智能家居、智慧商城和公共安全应急响应等应用场景扮演着日益重要的角色.然而室内定位系统有着数据量大,并发性强,大
沈阳市沈河区书协历史辉煌。20世纪70年代,“沈河区书法研究小组”即诞生于此,“四老”、“九畹”等常在此谈书论道,切磋技艺,为辽沈书坛之摇篮。为更好的传承历史,弘扬文化,
本文通过对荣华二采区10
期刊
现阶段,在素质教育背景下,小学语文教师在授课的时候不仅要重视相关知识和技能的传授,还必须高度重视对学生综合能力的培养.为此,教师必须改变传统“填鸭式”的教学方式,积极