论文部分内容阅读
微博作为近年出现的一种新型网络媒体形式,已经成为网络舆论表达的重要方式之一,如何把微博热点话题发现出来,正确的引导网上舆论,是当前的一个紧迫问题。本文考虑微博的特点,引入了语义相似度,提出了一个微博热点话题发现模型,包括数据采集、文本预处理、文本特征选择与表示、构建向量空间模型、相似度计算、聚类等过程。最后对话题簇按权重排名发现热点话题。