论文部分内容阅读
随着互联网的发展,各种类型的信息层出不穷,快速从过量的信息中找到感兴趣的内容已成为用户的迫切需求。因而,作为解决信息过载问题的有效手段,个性化推荐受到了广泛关注。个性化推荐能够根据用户的历史反馈信息,推测用户偏好特征及物品特征,并将满足用户偏好的物品推荐给用户,最终提升了用户服务体验。在这个过程中,获取全面、准确的用户反馈信息是实现个性化推荐的前提和基础,而针对用户反馈信息的获取和处理,目前主要面临三方面的挑战:(1)用户反馈的安全性:出于数据安全和个人隐私的顾虑,用户提交反馈信息的意愿不强,而缺乏用户反馈甚至会导致个性化推荐过程无法进行;(2)用户反馈的稀疏性:相较于海量的物品,每个用户提供的反馈信息的是非常稀疏的,而目标用户的反馈信息不足将影响对用户偏好特征的准确刻画;(3)用户反馈的准确性:恶意用户可能提供不符合实情的反馈,将误导物品特征的分析,进而可能导致对正常用户的推荐效果的下降。 本文详细分析了现有个性化推荐算法面临的挑战,针对用户反馈的安全性、稀疏性和准确性三个关键问题,研究基于用户反馈的个性化推荐方法,取得了如下研究成果: (1)在用户反馈的安全性方面,目前个性化推荐服务完全集中在服务器端,在这个过程中服务商能够获得用户的所有反馈信息。然而,出于隐私信息泄露的顾虑,用户往往不愿意提供反馈信息。为了激励用户提供更全面、更准确的反馈信息,本文提出了一种去中心化的隐私保护方法,由服务商和用户合作完成整个推荐过程,根据用户的个性化隐私设置,为用户反馈数据提供个性化的不同幅度的噪声干扰,更好地保护用户隐私信息。理论分析证明我们的方法能够满足差分隐私。基于真实数据集的实验结果表明,该方法隐私保护效果提升8%的同时推荐误差下降5%,实现了隐私保护和个性化推荐的有效平衡。 (2)在用户反馈的稀疏性方面,相较于用户对于物品的评价,用户对于他人评价的情绪反馈数目要更充足一些,且情绪反馈同样能够反映用户对相应物品的喜好。为了充分利用情绪反馈信息来缓解数据稀疏性问题对推荐效果的影响,本文提出了一种基于情绪反馈的用户偏好预测方法,将用户情绪反馈分为正面和负面两种,分析验证了正负面情绪反馈与用户偏好的相对关系,并基于分析验证结果将用户情绪反馈加入推荐系统中。实验结果表明,面对稀疏反馈数据,该方法推荐误差相较于其他方法下降高达48%;加入无历史评价的冷启动新用户后,其他方法上升高达27.6%的前提下,该方法最多仅上升1.46%。证明了对个性化推荐准确度的提升以及对于处理数据稀疏问题的有效性。 (3)在用户反馈的准确性方面,推荐算法对用户偏好特征的刻画影响恶意用户的检测和修正,恶意用户检测结果也影响了推荐效果,可见,推荐过程和恶意用户检测过程存在着相互干扰的问题,但目前却没有及时考虑二者的相互影响作用。为了及时识别恶意用户,降低其恶意反馈影响的同时充分利用其正常的反馈信息,本文提出了一种结合恶意用户检测和修正的推荐算法,引入用户的修正特征,由用户偏好特征、修正特征以及物品特征一起拟合已有的用户反馈,同时自适应地学习发现线下合谋关系。实验结果表明,该方法恶意用户检测准确率和召回率提升近1倍的同时推荐误差下降7%,在提高用户恶意用户检测效果的前提下,实现了个性化推荐效果的提升。