论文部分内容阅读
句子相似度计算在中文信息处理中有着非常广泛的应用.本文采用农作物种子信息文本,对句子进行深入的研究,通过对<同义词词林>的扩充,提出一种基于扩展的句子相似度的计算.该方法结合语料的特点,不仅考虑了句子间的公共子串,而且兼顾了词义距离.在对农作物种子文本的主题聚类的试验中,达到了比较满意的效果.