论文部分内容阅读
随着计算机技术的不断发展,Web已成为人们获取信息的一个重要途径。由于信息技术的高速发展,Internet上的信息资源呈指数膨胀,面对海量数据人们不得不花费大量的时间去搜索、浏览自己需要的信息。即使找到了一些,也经常混有很多“噪音”。针对这一问题人们提出了个性化推荐系统,它可以帮助用户在大量的信息中快速寻找到感兴趣的内容,并且将此项技术应用于网站建设中能充分提高站点的服务质量和访问效率,从而吸引更多的访问者。
协同过滤推荐是当前最成功的推荐技术。其基本思想是基于评分相似的最近邻居的评分数据向目标用户产生推荐。由于最近邻居对项目的评分与目标用户非常相似,因此目标用户对未评分项目的评分可以通过最近邻居对该项目评分的加权平均值逼近。它通过构造用户对项目的偏好数据集来实现,并不依赖于对这些商品必须有的文本描述。因此在个性化推荐系统中成为一项很受欢迎的技术。
本文对协同过滤及其在推荐系统中的应用、面临的问题和挑战以及相应的解决方法进行了详细的分析与研究。针对传统CF算法和基于项目评分的CF算法中存在的数据稀疏、扩展性以及计算效率问题,对其相似性计算和推荐集选取方法进行了改进,提出了一种改进的基于相关相似性的CF算法,以期产生更为准确的用户兴趣度预测,从而提高系统推荐的质量与推荐效率。具体内容包括:
1.总结分析协同过滤及其在个性化推荐系统中的应用和实现技术;分析其面临的主要问题和挑战(如:稀疏性问题、扩展性问题等)及现有的解决方法,如将SVD与协同过滤结合、聚类与协同过滤的结合等。
2.在实验的基础上比较基于余弦相似性、基于相关相似性与基于项目评分的CF算法的共同点、不同点以及优缺点。对其相似性计算和推荐集选取方法进行改进,提出了一种改进的基于相关相似性的CF算法。
3.利用一个被广泛使用和认可的实验数据集对改进算法进行实验验证,并对改进算法和原算法进行性能对比与评价。