论文部分内容阅读
主题情感混合模型可以有效地提取语料的主题信息和情感倾向.本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和情感分析.通过计算语料中词汇与情感种子词的距离,在吉布斯采样中对不同词汇赋予不同权重,利用每个主题下的关键词判断主题的情感倾向,进而得到每篇文档的情感分布.这种方法增强了具有情感倾向的词汇在米样过程中的影响,从而改善了主题间的区分性.实