论文部分内容阅读
互联网的发展为上网的人带来了浩瀚的信息,在用户浏览网站的时候,有些信息是用户感兴趣的,而有些信息用户不感兴趣,相对于网络中庞大的信息量来说,让用户自己去寻找感兴趣的信息比较困难,所以如何及时有效地将有用信息“送”到用户成为当前热点研究领域。为了实现这一目标,人们提出了推荐系统的概念。推荐系统根据统计结果或者用户以前的浏览记录来预测用户未来的行为,向用户提供其感兴趣的信息以帮助用户提高上网效率。推荐系统最早可以追溯到近似系统、信息检索和预测理论,在1995年随着第一种传统技术CF(Collaborative Filtering)的诞生开始成为研究热点[Adomavicius2004]。最近,由于传统技术的局限性,一些基于新技术的推荐系统开始成为研究的对象,其中基于WEB使用挖掘技术的推荐系统能够很好的解决传统技术的不足,所以得到了广泛的应用和深入的研究。
本文介绍了推荐系统的基本概念,描述了基于Web挖掘推荐系统的发展历程和一般工作流程,以及Web挖掘推荐系统使用的三种主要技术,在阐述这些技术的不足之处的基础上,提出了一个应用于推荐系统的Web挖掘算法AIR(AlgorithmIntegrating clustering analysis,association rule and sequential patternfor Recommender system),该算法将三种主要技术融合在一起,在聚类技术保证覆盖率的基础上,结合关联规则和序列模式,从而得到理想的结果。进行实验数据的比较,并用公认的判断标准来比较实验效果,从中可以看出AIR算法在保证准确率与序列模式相当的情况下,大幅度提高了覆盖率,从而验证该算法的有效性。