论文部分内容阅读
推荐系统是一种解决信息过载和提供个性化服务的信息系统,它与信息检索系统形成了“推信息”与“拉信息”的良好互补关系。推荐系统的主要价值在于:1)它能够帮助用户去发掘和扩展他们的兴趣;2)它能够帮助内容提供商将内容以一种友好的方式推送给潜在的感兴趣的用户。推荐系统设计的主要思路是针对用户与物品隐性的或者显性的交互行为数据,以及用户和物品各自的特征,利用数据挖掘、机器学习和统计学等技术,来预测用户对其他物品的兴趣。推荐系统的评测主要包括了准确性、覆盖率、多样性、新颖性和惊喜性等维度,每个维度分别有不同的度量指标。 近年来,众多社会媒体纷纷涌现,这为推荐系统在数据类型和推荐类型方面带来了新的机遇与挑战。本文主要从三个方面来研究社会媒体中的推荐系统:1)对于社会化标签系统,如何利用用户-标签-物品三者的关系解决数据稀疏性问题;2)如何利用社会化标签系统中的标签信息提升推荐结果的多样性和新颖性;3)利用谱方法研究社交网络中的朋友推荐与信息传播的关系。本文的主要贡献有以下几方面: 提出了一种面向社会化标签系统的基于随机游走的物品推荐模型 为了解决社会化标签背景下物品推荐中的数据稀疏性问题,本文提出了一种基于随机游走的物品推荐模型,它能够有效利用用户、标签和物品三者间的传递关联关系。利用这些传递关联关系可以使得用户-物品、用户-用户和物品-物品等实体之间的关联性的度量更加准确。据此,我们设计了一种类似于PageRank的算法,它通过利用物品图和用户图上的多步随机游走,可以获得用户、标签和物品三者间的传递关联关系以及个性化的物品排序列表。三个真实数据集上的实验评估表明:与几个基本方法相比,该方法能够有效地缓解数据稀疏性和提高物品推荐的准确性。 提出了一种利用标签信息提高物品推荐多样性和新颖性的方法 针对社会化标注数据,本文提出了一种基于扩展用户兴趣广度的新推荐算法框架,该框架可以同步提升推荐结果的相关性、多样性和新颖性。该算法框架主要分为两大部分:扩展用户最初选择的物品集以及传统的协同过滤推荐模型。该框架的优势有:1)它扩展了用户的兴趣范围;2)增加了作为传统的协同过滤推荐模型输入的用户-物品交互矩阵的稠密程度;3)易于和传统的协同过滤推荐模型进行组合。在实验评估部分,本文提出了一种可用于测量推荐列表多样性的测量指标,即标签覆盖率。本文采用了来自三个真实的社会化标签系统的数据集验证本章所提出的算法。实验结果表明:该算法在相关性、多样性和新颖性三个维度都明显地优于原来的协同过滤推荐算法。 基于谱方法对社交网络中的朋友推荐和信息传播进行研究 本文使用谱方法研究了社交网络中链接推荐和信息传播之间的关系。首先,我们测试了网络的谱半径与该网络上信息传播程度的相关关系,通过实验发现了它们之间有很高的皮尔森相关系数。然后,为了能够通过链接推荐促进信息传播,我们提出了一种组合传统链接推荐算法和特征值中心度的启发式算法。在实验评估中,我们使用了三个真实的网络数据集,在推荐结果的相关性和网络结构的信息传播能力方面,测试了我们的方法以及两种基于其他中心度的方法。实验评估的主要发现是:这些基于中心度并采用重排序策略的链接推荐方法几乎都会降低推荐的相关性,但是在大多数情况下能够提高网络结构的信息传播能力。