论文部分内容阅读
在大数据时代的今天,随着推荐系统的出现并成功应用于日常众多领域,这不仅在一定程度上缓解了信息过载问题,给人们生活带来了便利,还推动了网络经济和社会的发展。推荐系统是近年来研究热点,根据推荐服务对象的不同可分为:个性化推荐和群组推荐。群组推荐是向由2个或2个以上用户组成的群组提供推荐服务,它是在个性化推荐基础上发展而来,但又复杂于个性化推荐,其处理过程中需要考虑更多因子。群组推荐因为广大群体用户提供推荐服务而具有极广的商业应用前景和极大的社会价值。本文围绕群组推荐相关理论、算法及存在的问题展开研究,内容组织及主要的研究工作如下:首先,在理论研究方面。由于目前国内外对群组推荐的研究并没有对个性化推荐的研究那么火热,有关群组推荐方面的文献资料相对较少,尤其中文性文献资料更是数量可数。因此,本文通过对国内外群组推荐研究现状的研究与分析,对相关文献的梳理、提炼和综合,从而形成了较全面的群组推荐的基础理论知识,主要包括群组推荐的概念、推荐生成过程、群组推荐的关键技术、群组推荐的方法分类、群组推荐的实验数据集及评价指标等内容,希望对学习、研究群组推荐的入门者有一定的帮助。其次,在算法研究方面。针对当前大多数群组推荐算法中所采用的聚合方法(评分聚合或推荐结果聚合,并且一般只用到显性评分信息而忽略了隐性反馈信息),容易导致群组中部分成员偏好信息丢失的问题和群组推荐中数据稀疏性问题,本文利用群组推荐和个性化推荐间推荐原理、过程相似性,借鉴个性化推荐中采用的措施方法并结合SVD++模型的特性以及群组推荐的特点,从而提出基于SVD++的协同过滤群组推荐算法,与此同时,提出不同于传统群组推荐的聚合策略——特征因子的聚合。文中首先采用基于物品的协同过滤方法对评分矩阵中部分评分缺失项进行评分预测并填充,以缓解群组推荐中数据稀疏性问题。然后,通过随机梯度下降法对评分矩阵进行分解得到用户特征因子向量、物品特征因子向量以及隐性反馈因子向量,接着,采用特征因子聚合策略对群组中用户相关的特征因子向量进行聚合从而得到群组的特征因子向量,最后,利用SVD++模型预测群组评分,对评分排序实现推荐。以此减少群组中成员偏好信息丢失问题,进而提高推荐准确率。最后,在算法模拟实验和系统设计与实现方面。通过模拟实验检验了本文方法在不同规模群组上的效果以及在缓解数据稀疏性方面的效果,并且将本文提出的基于SVD++的协同过滤群组推荐方法与当前效果较好的群组推荐方法进行了对比,实验结果显示:本文方法在推荐准确率、召回率方面均要优于相关的群组推荐方法。此外,本文还进一步设计并实现了基于SVD++的协同过滤群组推荐系统原型。