论文部分内容阅读
随着互联网信息开放式的发展,互联网中的信息指数式增长,信息过载的问题日益严重。如何在大量的信息中筛选出用户需要的信息成为当今互联网急需解决的问题。推荐系统就是诞生在这样的背景下,推荐系统可以根据一定的算法挖掘出用户需要的有效信息。随着推荐系统的发展,其核心的推荐算法也层出不穷。因此本文选择推荐算法作为研究的重点之一。在推荐算法中协同过滤是比较成熟的推荐技术。然而协同过滤技术中,由于其过度依赖于用户项目的评分矩阵,在有效数据不足的条件下,推荐准确度会随着矩阵的稀疏而下降。本文针对于协同过滤技术中的评分矩阵的稀疏性问题,提出了一种结合项目属性相似性的混合推荐算法。在基于项目的协同过滤相似性计算的过程中,通过评分矩阵用户的评分聚集程度产生动态因子,将基于项目本身属性的相似性与协同过滤中项目相似性动态结合,从而解决了矩阵的稀疏性问题。通过实验的比较可以得出,本文设计的混合推荐算法对比传统的协同过滤具有较好的准确度。混合推荐算法的预测虽然有较好的准确性,但是算法过程的融合导致算法复杂度增加。因此本文将推荐算法与Hadoop云计算平台进行了结合,在对Hadoop平台中的分布式文件系统HDFS和MapReduce并行编程模型深入研究后,将推荐算法中复杂的项目相似度计算过程MapReduce并行化,提高了算法的计算效率。通过MovieLens的数据集合实验证明,混合推荐算与Hadoop云计算平台具有比较好的并行性能,同时也凸显了Hadoop云计算平台的优势。本文深入的研究了推荐算法和云计算的相关知识后,针对协同过滤的问题提出了混合推荐算法,并将算法与Hadoop云计算平台相结合,提高算法运算效率。实验证明,混合推荐算法与云计算平台的结合具有较好的推荐质量和较高的运算效率。