论文部分内容阅读
文本相似性分析是一种重要的自然语言处理技术,主要应用于文本分类、聚类等领域.目前业界使用的基于TF-IDF的余弦相似度的文本相似性分析虽能取得不错的成效,但仍有一定的缺陷.对目前的基于TF-IDF的余弦相似度分析法,本文旨在对其进行分析并提出几种相应的优化策略,通过实验给出其中相对较优解决方案.