基于知网的个人微博语义相关度的聚类研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:lisong459
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类相关度大的个人微博有助于快速了解博主的专业兴趣和经历,目前的短文本聚类方法缺乏对于语义和句子相关度的充分考虑,提出了一种基于知网的个人微博语义相关度的聚类方法。其要点如下:(1)利用Skip-gram训练大量微博文本生成词汇向量;(2)根据词汇义原进行句内词汇消除歧义;(3)分别计算个人微博之间词汇和句子的相似度并将其综合得到博文相关度;(4)根据博文相关度进行个人微博的聚类。实验表明,相较于层次聚类法、密度聚类法,本文算法的准确度有明显提高。
其他文献
本文以泰州里下河地区民营企业为研究对象,通过问卷、走访了解了该地区100家民营企业银行信贷行为。调研发现,泰州里下河地区民营企业存在银行信贷、中大数额和中长期信贷偏
<正>心力衰竭是各种心脏疾病导致的心功能不全的一种综合征。因心肌收缩力下降而导致心排血量不能满足机体生理需要,临床上以肺循环和(或)体循环淤血以及组织灌注不足为主要
针对实体链接中候选集构建问题提出了一种多策略结合的候选集构建算法。综合利用多种策略提取上下文中的完整指称,降低候选实体数量,同时提高正确实体的召回率,构建一个高质
针对高校科研能力评估过程中存在的多因素、高非线性特点,经典评估模型主观性较强,导致模型评估准确性不高的问题,提出基于协同智能水滴算法IWD和粗糙集块神经网络RBNN的高校科研能力评估模型。首先,引入智能水滴算法,并针对传统智能水滴算法固定旁域搜索范围不利于提升算法搜索效率的问题,提出一种局部空间自动缩放算法LSAS,该算法根据当前种群最优个体,自动调整下一步搜索空间大小,对进化过程进行指导,提高算