基于张量分解的推荐算法研究

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:zqfc2058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,人们从信息匮乏时代过渡到了信息过载时代,用户很难从海量的数据中找到自己感兴趣或对自己有价值的信息。推荐系统是应对信息过载问题的一个有效的解决办法。当前,基于模型的推荐算法是推荐系统研究领域的热点方向,具有推荐精度高、善于发现用户新的兴趣点、可扩展性好等优点。但是,基于模型的推荐算法仍然存在的一些问题。第一,忽略时间因素对推荐系统的影响。传统的推荐模型是静态的,忽略了时间因素,部分推荐算法虽然将时间因素考虑在内,但只是使用最近的数据或者给过去的数据降低权重,这样可能会造成有用信息的丢失。第二,优化目标与推荐系统目标不一致。推荐系统的最终目的是对用户形成推荐项目序列,传统的基于模型的推荐算法先预测用户对项目的评分,然后依据评分生成推荐序列。这些推荐算法的重点是评分预测,可是能很好地预测评分不一定能很好地进行项目推荐。本文针对这两个问题,在现有的研究工作的基础上进行了改进,提出了两种改进的推荐算法。针对第一个问题,本文提出了一种改进的基于时间的局部低秩张量分解推荐算法。该推荐算法在传统的推荐算法的基础上,考虑时间因素,把评分矩阵看作是用户、项目、时间三个维度的张量,将传统的推荐算法延伸到张量领域。针对第二个问题,本文提出了进一步的改进算法局部低秩张量分解排名推荐算法。首先,为了提高排名推荐效果,该算法选择直接优化排名评价指标倒数排名函数均值(Mean Reciprocal Rank,MRR);其次,为了能够充分利用数据集合中的信息,该算法修改该评价指标使其适合显式反馈数据集合;然后,为了能够使用标准最优化方法对修改后的评价指标进行优化操作,该算法对其进行平滑化操作;接着,为了简化优化操作的过程,该算法求出平滑化后的评价指标的下界;最后,该算法将该评价指标的下界作为目标函数,使用随机梯度上升法对其进行优化操作。实验表明,这两种推荐算法都能提高排名推荐效果。
其他文献
随着遥感影像的空间分辨率不断提高,传统的基于像素的信息提取技术已不能很好地提取影像中的土地信息,它产生的专题图中土地完整性差并且混分、错分现象严重,同时无法解决“同谱异物”与“同物异谱”的问题。根据高分辨率遥感影像的特点,本文以对象为最小的操作单元进行农村地区土地信息提取,对象通过影像分割得到。针对现有的对象分割技术在分割过程中出现的精度缺陷与自动化程度低等问题,提出了一种基于多特征数据融合与对象
随着社会信息化与网络化的高度发展,信息安全的重要性也与日俱增。身份识别技术作为信息安全的一个分支以其特有的稳定性、唯一性和方便性,得到越来越广泛的应用。   掌纹图
GCC是GNU中的旗舰产品,也是开源世界的重量级产品,大多数开源产品都是基于这个编译器的。GCC是一个编译器的集合,其中的C++编译器就是G++。GCC采用前端、后端相结合的方式,前
剪接体内含子的发现已有30余年,但目前对其进化机制和进化动力学的了解很贫乏。学术界对内含子的进化问题一直存在争议,其中之一就是内含子得失率。内含子的进化研究方法常是用
无线传感器网络作为进化计算中崭新的一章,已经被证明了对诸多的领域,如国防安全、监控、环境监测、农业、以及医疗,起到了巨大的推动作用。由于它在物理世界以及数字世界之间的
关联规则挖掘是数据挖掘中的重要内容之一,旨在发现大量数据中项集之间的关联或相关关系。将关联规则挖掘技术应用于Web使用挖掘中,可以更有效地组织和管理网站,找出站点用户
无线自组织网是近年来随着无线通信技术的飞速发展而出现的一种新型网络,网络中所有节点可以任意移动,网络拓扑结构动态变化,节点间以多跳协作的方式进行通讯。作为无需基础
下一代互联网为用户带来了丰富多彩的用户体验,但同时庞大的网络流量也给网络管理人员及服务提供商带来了巨大的挑战。流量监测是保障网络可控性的基础。目前传输速率为10Gbp
专利的技术方案信息是专利信息的重要组成部分,是专利作者创新精髓,是专利保护的主要对象。然而技术方案信息是以自由文本的形式存在,因此如何将技术方案信息转化为计算机可处理
流媒体点播(Video-on-Demand)系统的应用随着宽带技术的日益成熟而得到越来越多的关注。系统的结构也由最初的C/S架构转为现在流行的P2P(Peer-to-Peer)模式,因为P2P模式可以更