论文部分内容阅读
当前主题分析主要采用基于词表的自动抽词技术,这种方法的局限性在于无法处理知识库中未登录的关键词.因此本文提出了在专家知识库的词典匹配基础上,结合词的串频统计技术,进行自动主题分析,获取文档的关键词候选项.实验证明,该方法可以获得94%以上的召回率,并且获取结果中合理串的比例达到96%,从而保证了自动标引的进一步处理.