社会媒体中的推荐系统研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cuidayue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是一种解决信息过载和提供个性化服务的信息系统,它与信息检索系统形成了“推信息”与“拉信息”的良好互补关系。推荐系统的主要价值在于:1)它能够帮助用户去发掘和扩展他们的兴趣;2)它能够帮助内容提供商将内容以一种友好的方式推送给潜在的感兴趣的用户。推荐系统设计的主要思路是针对用户与物品隐性的或者显性的交互行为数据,以及用户和物品各自的特征,利用数据挖掘、机器学习和统计学等技术,来预测用户对其他物品的兴趣。推荐系统的评测主要包括了准确性、覆盖率、多样性、新颖性和惊喜性等维度,每个维度分别有不同的度量指标。  近年来,众多社会媒体纷纷涌现,这为推荐系统在数据类型和推荐类型方面带来了新的机遇与挑战。本文主要从三个方面来研究社会媒体中的推荐系统:1)对于社会化标签系统,如何利用用户-标签-物品三者的关系解决数据稀疏性问题;2)如何利用社会化标签系统中的标签信息提升推荐结果的多样性和新颖性;3)利用谱方法研究社交网络中的朋友推荐与信息传播的关系。本文的主要贡献有以下几方面:  提出了一种面向社会化标签系统的基于随机游走的物品推荐模型  为了解决社会化标签背景下物品推荐中的数据稀疏性问题,本文提出了一种基于随机游走的物品推荐模型,它能够有效利用用户、标签和物品三者间的传递关联关系。利用这些传递关联关系可以使得用户-物品、用户-用户和物品-物品等实体之间的关联性的度量更加准确。据此,我们设计了一种类似于PageRank的算法,它通过利用物品图和用户图上的多步随机游走,可以获得用户、标签和物品三者间的传递关联关系以及个性化的物品排序列表。三个真实数据集上的实验评估表明:与几个基本方法相比,该方法能够有效地缓解数据稀疏性和提高物品推荐的准确性。  提出了一种利用标签信息提高物品推荐多样性和新颖性的方法  针对社会化标注数据,本文提出了一种基于扩展用户兴趣广度的新推荐算法框架,该框架可以同步提升推荐结果的相关性、多样性和新颖性。该算法框架主要分为两大部分:扩展用户最初选择的物品集以及传统的协同过滤推荐模型。该框架的优势有:1)它扩展了用户的兴趣范围;2)增加了作为传统的协同过滤推荐模型输入的用户-物品交互矩阵的稠密程度;3)易于和传统的协同过滤推荐模型进行组合。在实验评估部分,本文提出了一种可用于测量推荐列表多样性的测量指标,即标签覆盖率。本文采用了来自三个真实的社会化标签系统的数据集验证本章所提出的算法。实验结果表明:该算法在相关性、多样性和新颖性三个维度都明显地优于原来的协同过滤推荐算法。  基于谱方法对社交网络中的朋友推荐和信息传播进行研究  本文使用谱方法研究了社交网络中链接推荐和信息传播之间的关系。首先,我们测试了网络的谱半径与该网络上信息传播程度的相关关系,通过实验发现了它们之间有很高的皮尔森相关系数。然后,为了能够通过链接推荐促进信息传播,我们提出了一种组合传统链接推荐算法和特征值中心度的启发式算法。在实验评估中,我们使用了三个真实的网络数据集,在推荐结果的相关性和网络结构的信息传播能力方面,测试了我们的方法以及两种基于其他中心度的方法。实验评估的主要发现是:这些基于中心度并采用重排序策略的链接推荐方法几乎都会降低推荐的相关性,但是在大多数情况下能够提高网络结构的信息传播能力。
其他文献
该文分析了当前信息搜索服务的现状,研究了现有搜索引擎的技术原理,选择了元搜索引擎技术作为研究的主要方向.在指出元搜索引擎技术优势的同时,对其局限性做了深层次地分析,
该文通过对最新目录服务技术的跟踪研究,以及对目前较大规模企业目录服务系统现状的分析,以一家大型跨国公司的统一目录系统规划建设为实践基础,探讨了规划建设统一企业目录
该论文对决策支持系统(GSS)、贝叶斯网络及贝叶斯网络在决策支持系统中的应用进行了系统的阐述.给出了决策、数据采掘、联机分析处理、数据库之间的关系图及数据采掘与知识发
该文将软件组件技术应用于分层数据库应用系统体系结构设计.以面向对象理论为指导,提出了"用户界面类→系统外部功能类→系统底层基本功能类"的开发模型,分析了组件化程序的
该文内容包括:首先,采用微软的解决方案框架和软件工程学的UML设计思想,规划出弧面凸轮机构的CAD系统结构框架.其次,系统分析了弧面分度凸轮的轮廓结构及其啮合特性.最后,完成
该文介绍了基于JXTA协议的对等网络通讯模式、计算技术、搜索技术.并谋略通过建立有效的信息分类代码机制来完善和充实对等网络应用中的信息发布、检索和索引技术.为了充分利
我们和广东省人事厅合作开发的工资智能决策支持系统(SIDSS),是一个智能决策支持系统在实际的软件开发中的具体应用。其目的是将各单位的人事部门从繁琐的工资调整工作中解放出
该文研究主动数据库系统中规则的分析和优化问题.规则分析主要考查规则的两个特性;可终止性和一致性的问题.规则优化主要考虑对规则的预先处理.主动面向对象数据库技术是当今
该文通过时SIP协议族的研究以及和国内外已被广泛应用的另一种VOIP技术——H.323协议族的比较,从协议框架、网络结构和消息传递三大部分全面分析了这种新型的基于SIP的VoIP系
计算机支持的协同工作(Computer Supported Cooperatlve Work,简称CSCW)是研究地域分散的一个群体如何借助计算机及其网络技术支持,共同协调与协作完成一项任务的技术领域.