论文部分内容阅读
随着电子商务技术的发展,人们越来越多地使用网络来获取自己想要的信息,因此,如何根据用户信息来推测他们的兴趣,成为了各个网站研究的热点。协同过滤系统是当前应用较多且较为成功地个性化推荐系统。但是因为在系统刚“启动”阶段,数据库中的数据是十分稀疏的,这造成推荐效果并不理想,所以,如何提高推荐的精度成为了当前协同过滤推荐系统研究的热点问题。
本文全面论述了电子商务系统应用现状、协同过滤系统与电子商务系统的关系以及协同过滤算法的两个方向等方面的知识。分别从基于用户的协同过滤算法和基于项目的协同过滤算法角度分析了当前协同过滤算法所遇到的问题,并提出了相应的改进思路。
本文的主要研究成果如下:
1)提出了结合项目特征分析的协同过滤算法。通过对项目特征的分析来计算用户对未评分项目的评分,随后利用基于项目的余弦相似性计算找出未评分项目的相似项目,并使用本文提出的预测公式预测未评分项目的评分。实验结果表明,算法在用户评分数据稀疏的情况下,可以改进推荐效果。
2)提出了基于项目相似度计算改进的协同过滤算法。通过对基于项目的传统协同过滤算法相似度计算公式的思路分析,指出了该公式在冷启动应用中存在的问题,由此提出了改进的相似度计算方法,通过实验证明算法在提高推荐质量方面的有效性。
3)提出了结合用户特征知识的协同过滤算法。本文认为同一群体的人,兴趣偏好有着一定的相似性,通过实验验证了这一观点。实验中,将用户的群体特征作为相似性计算的一个考虑因素进行计算,结果表明,推荐精度有一点提高。通过该实验可以得到如下的启发:当数据库中的数据增多时,为了提高响应度,可以先基于用户特征知识进行聚类而后在聚类中寻找相似用户。当然,这需要进一步地实验论证。
4)提出了基于模糊聚类的协同过滤算法。利用模糊聚类的方法将项目聚类,结合用户对聚类项目打分的相似性,计算用户之间的相似性,选出当前评估用户前num个对未评分项目已评分的最近邻用户,基于最近邻用户的评分预测当前评估用户的未评分项目的评分。实验证明,该算法提高了“冷启动”问题下的相似度计算精度,改善了推荐的效果。
以上所提及的四种改进算法,其中第一和第二种算法是从基于项目的角度进行改进的,而第三和第四种算法是从基于用户的角度改进的。