论文部分内容阅读
一词多义是普遍现象,而且随着时代的发展和语言的丰富,词义在使用中随时在变化着,这是语言学家也无法准确把握或预测的现象,本文利用索引系统对实体名词的多义进行了分析,希望可以通过统计理论区分词义。
首先,本文介绍了研究背景和现状,确定了本文的研究的目标——多义实体名词,结合搜索引擎百度和谷歌的实例,对词义区分的必要性和可行性进行了深入探讨,并介绍了现有技术和研究情况。
然后,介绍了一种高性能的索引结构以及检索系统的技术方案,即从一个被一组关键词索引的文档集合中根据搜索请求与被索引文档的相关程度而选取的一批文档,所述搜索请求来自使用计算机或者计算机网络的用户。
最后,本文对查询词的多义判断实现了在搜索引擎中的应用,进行了系统介绍,包括设计与实现过程,以及对实验结果的评测分析。