嵌入标签信息的评分预测协同过滤算法研究

来源 :南京师范大学 | 被引量 : 1次 | 上传用户:lycwmy01011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技高速发展的今天,如何从纷杂的信息大世界中获取有用信息,解决信息超载问题,已成为一项具有挑战性的工作。推荐系统作为解决信息超载问题的有效途径,成为当前学术界的热点问题。推荐算法是推荐系统中的核心组件,其中,协同过滤推荐算法由于其简单且易于实现的特点,被广泛使用。针对推荐系统中存在的数据稀疏性和冷启动问题,研究者提出了基于近邻和基于矩阵分解等有效的协同过滤算法。在使用基于近邻的协同过滤算法进行评分预测时,用户间和项目间的相似度度量策略的选择是影响推荐质量的关键,但是仅使用评分矩阵无法真正衡量相似度,为此,针对如何利用系统中存在的额外信息来改进用户间和项目间的相似度成为了本文的主要任务。论文围绕用户间和项目间的相似度度量方法、如何有效利用标签信息和时间信息这两个方面展开研究。论文的主要工作如下:1.提出一种结合评分和项目相关性的协同过滤算法模型(URIC)该算法结合评分信息和项目的属性标签信息,将项目的属性相关性以及兴趣相关性融入到相似度计算过程中以此弥补仅基于评分矩阵计算相似度的不足,通过在MovieLens数据集中进行的对比实验,结果表明URIC算法具有较好的推荐结果,可以有效地缓解数据稀疏性问题。2.提出一种结合标签和时间因素的协同过滤算法模型(TT-CF)该算法结合标签信息和时间信息对传统的协同过滤进行改进。利用标签信息和评分信息计算用户间和项目间的相似度克服仅基于评分矩阵计算相似的不足,同时引入时间权值,对用户最近的评论过的项目给予较大的权值,强调用户最近的兴趣行为,在MovieLens数据集中进行的对比实验,结果表明TT-CF算法能够改善推荐的准确性,缓解数据稀疏性问题。3.提出一种结合LDA主题模型和巴氏系数的协同过滤算法模型(UBL-CF)该算法结合LDA主题模型和巴氏系数改进传统的协同过滤算法。利用LDA主题建模方法在用户标签集和项目标签集上挖掘隐含的主题信息,引入巴氏系数利用用户间的所有评分信息克服共同评分的限制,缓解数据稀疏性问题。
其他文献
Android系统的开源、开放等特性虽然带来了大量的市场占有率,但是也使得Android系统成为了恶意应用的首要攻击目标。同时,越来越多的应用通过访问用户私人数据为用户提供智能
本文主要的研究内容是融资融券交易行为对我国上市公司盈余质量的影响。上市公司的盈余状况反映的是其发展状况和经营成果,在经历众多国内外财务舞弊或盈余操纵的事件后,上市
设备维修管理研究对于HGPM厂建立现代设备维修管理体系具有重要意义。通过系统的研究该厂的设备运行指标,深入分析设备维修管理存在的问题,建立现代设备维修管理体系,能够使
随着社会经济持续快速增长和信息技术的突飞猛进,通信消费水平不断提升,为通信市场的发展提供了巨大的推动力量。面对当今的语音通讯市场,个人移动业务已经占据较大份额,而公
医学图像融合是对多幅不同模态的医学图像进行信息综合,合成一幅包含所有源图像重要信息的融合图像的过程,能够获得比单一模态医学图像更全面的诊断结论。为了能够对图像中每
随着计算机技术、人工智能技术的发展,计算机视觉成为一个越来越热门的研究领域。通过立体图像序列估计场景流是计算机视觉研究领域的重要研究内容。场景流估计是三维运动研
为促进经济发展,许多国家逐步加大轨道交通等基础设施建设,全球轨道交通装备行业整体趋于活跃,市场需求逐步释放,这为戚墅堰公司加快国际业务布局提供了难得的机遇。同时国家
近几年环境污染日益严重,CO、SO2等有害气体排放也日益增多,因此传感器对于气体检测的应用需求更加明显。声表面波气体传感器具有高灵敏度、高精度,低功耗便于集成等优点,并
设施大棚内连作障碍问题日益突显,已有众多研究表明,通过水旱轮作能有效缓解连作障碍,秸秆覆盖有利于培肥土壤。本试验通过水旱轮作结合小麦秸秆覆盖进行连续还田,夏秋茬淹水栽培蕹菜,冬春茬旱作小白菜,并在水作期间以2500 kg/亩和1500 kg/亩的覆盖还田方式,覆盖截段为10 cm的小麦秸秆开展试验,同时进一步扩展大田试验,利用小麦机械切段秸秆覆盖还田湿润栽培湖北绿梗芋,探究对蔬菜产量品质及对土壤性
非本征光纤珐珀传感器具有结构简单、高灵敏度、可避免电磁干扰等优点,在深井探测、电气局部放电及建筑结构健康状态监测等领域中得到广泛使用。论文首先介绍了光纤EFPI传感