论文部分内容阅读
随着因特网技术在人类社会活动中的应用越来越广泛,因特网中信息的规模越来越大。庞大的信息数量使得大部分人难以自己检索需要的信息,而只能通过搜索引擎帮助检索。但现有的搜索引擎针对不同的用户返回的是相同的结果,没有考虑用户之间的个性差异,这导致在查询二义词时,必然有一部分用户的体验比其它用户差。而根据调查,中国的用户通常只对第一页的信息感兴趣,这就要求搜索引擎需要根据用户的兴趣将符合其兴趣的搜索结果尽量靠前。但另一方面,搜索引擎返回的搜索结果本身已经考虑到了大部分用户的兴趣、习惯,同时用户也可能会对其它领域也产生临时兴趣,所以完全否定搜索引擎现有排序也是不可取的,可能会过度适应用户的兴趣,导致其只能看到某个领域的内容。本文提出一种基于模糊粗糙集的个性化搜索引擎重排序算法,在百度搜索引擎原始搜索数据的基础上,通过重排序,实现个性化搜索服务。首先,本文阐述了个性化搜索引擎的一些相关知识;然后提出了一种两级用户兴趣模型,将一级兴趣视为模糊粗糙集的上近似集,二级兴趣视为下近似集;接着提出一种基于模糊粗糙集相似度的重排序算法,计算百度搜索引擎返回结果和用户兴趣模型的相似度,然后结合进百度原有排名;最后,本文列举了实验的结果,并对实验的结果进行了分析,表明可以满足个性化的需求。