论文部分内容阅读
随着互联网的发展,网络信息增多,“信息超载”问题日渐突出。解决这一问题的有效途径就是搜索技术和个性化推荐技术。个性化推荐通过分析用户行为,为用户建立兴趣模型,预测用户行为模式,再主动将有效信息推荐给用户。与搜索技术相比,不需要用户主动键入搜索内容是推荐技术的一大特点。在这种环境下,推荐系统越来越受到网络用户欢迎。协同过滤算法作为推荐算法中最受欢迎的算法之一,具有重要的研究价值及意义。即使应用广泛,大量研究表明协同过滤算法仍面临以下几个主要挑战,(1)数据稀疏问题,(2)冷启动问题,(3)推荐效率问题,(4)可扩展性问题。基于用户的协同过滤算法广泛应用于推荐系统,它分析用户的行为数据,为用户寻找兴趣爱好接近的领域用户,再将领域用户评分高的商品推荐给当前用户。基于用户的协同过滤算法推荐精度高,效果好,然而数据稀疏问题同样严重影响其推荐效率。针对改进数据稀疏和提升算法推荐效率两个难点,本文对基于用户的协同过滤算法相关技术进行研究,提出一种改进算法。具体研究工作如下;(1)为了缓解数据稀疏,提出一种评分矩阵填充算法。传统算法通过项目属性相似度填充评分矩阵,改进算法在此基础上先衡量不同属性值的信息量,信息量大的值在计算相似度时赋予的权值大,该属性值对相似度计算结果的影响更大,本文通过信息熵来衡量属性的信息量。(2)协同过滤算法会在优化过的评分矩阵上进行计算。在计算用户相似度时,基于用户的协同过滤算法只计算用户评分相似度,本文在计算用户相似度时,同时考虑到两个用户公共评分项目的数量对结果的影响,公共评分项目数量越大,即使评分不同也可以说明两个用户喜好接近,除此之外,在计算相似度时还加入用户评分次数相似度,推荐系统中项目数量过多,可能很多用户公共评分项目不足。这个时候可以将公共评分项目转化为公共评分属性,两个用户如果对同种属性的项目评分次数接近,也可以表示两个用户喜好接近。通过在movielens数据集上测试,证明本文设计的改进算法可以有效提高推荐系统的推荐准确度。最后对图书推荐系统进行需求调研,设计出推荐系统的总体框架,保证功能模块和数据存储可以正常使用,将改进协同过滤算法应用起来。