基于多维隐式反馈数据的推荐系统研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:joinnow06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统可以主动为用户推送信息,帮助用户迅速锁定偏好物品或服务,提升用户体验,同时为服务提供方定位目标人群,达到精准营销的效果,是对服务接受者和提供者来说,实现双赢的有效工具。目前,大多数推荐算法是针对显式反馈数据而设计的,但显示反馈数据需要用户主动参与,从而数量和种类较少,缺乏普适性。而隐式反馈数据代表用户行为记录,相比而言更为常见且更具代表性,因此基于隐式反馈的推荐算法的研究获得了越来越广泛的关注。其次,隐式反馈数据种类繁多,相互影响,如何合理地融合多维隐式反馈并进行准确高效的推荐是推荐系统研究领域亟待解决的问题。因此,基于多维隐式反馈数据的推荐算法具有重要的研究意义。本文提出了多维隐式反馈数据下的推荐模型假设,并讨论了直接隐式反馈和间接隐式反馈的融合方法,建立了基于物品相似度的基础模型--HCoM算法,同时结合数据的时间以及频率特性分别从时间漂移以及新颖度两个方面进行了拓展研究,主要的研究工作包括:第一,针对多维隐式反馈数据提出了融合直接隐式反馈和间接隐式反馈的推荐算法,该模型考虑物品相似度对推荐结果的影响并利用最优化方法从数据中直接学习出模型参数。第二,分析了结构化风险函数的各个模块对推荐质量的影响。对比了基于打分的损失函数和基于排序的损失函数的不同,进一步分析了不同正则化约束的作用域和优缺点,提出了自定义正则化项—HC来约束直接隐式反馈和间接隐式反馈之间的关系。第三,考虑用户偏好产生的时间漂移,利用时间衰减函数调整隐式反馈数据,同时研究推荐结果新颖度的问题,根据用户行为的频次对原始模型进行调整。第四,提出了推荐系统的实验方案以及具体实现并在真实数据集上与目前主流的baseline算法进行了对比。本文首先介绍了论文的研究背景,其次对推荐系统领域相关文献进行了综述,同时对基于隐式反馈数据的推荐系统文献进行了梳理并分析了现实情况的问题和现有文献的不足。然后提出了一种融合直接隐式反馈和间接隐式反馈的推荐算法—HCoM算法,同时从时间漂移以及新颖度两个方面对原始模型进行了拓展。接着利用天猫销售数据以及IJCAI大赛数据对该算法进行了实验,并与目前主流的baseline算法进行了对比,验证了论文假设以及推荐效果。最后实现了电子商务平台的原型系统,并且为该平台设计了推荐引擎,以体现个性化推荐算法与实际业务场景结合的应用价值。
其他文献
核能作为一种绿色环保可持续的清洁能源,正在被越来越多的国家和地区关注应用。第四代核电系统中2.25Cr-1Mo钢是蒸汽发生器主体结构材料,为了应对核电反应堆中复杂苛刻的工作环境,该钢种在的冶炼工艺和性能都有所提高,国内已经开始工业试制。该钢的抗蒸汽氧化性能是评价材料可靠性的重要指标之一,本文研究核电用2.25Cr-1Mo钢的抗蒸汽氧化性能,为该材料的应用提供技术基础。本文在460℃、480℃、50
近年来三元MAX相材料因独特的物理和化学性能已成为材料领域研究的热点,它既具有金属良好的导热和加工性能,同时又具有陶瓷的高熔点、高热稳定性和良好的抗氧化性能,将其作为金刚石工具制品结合剂,有望解决传统金属或陶瓷结合剂材料存在的强度和耐磨性难以匹配问题。同时传统的热压和无压烧结制备MAX相材料过程中存在样品尺寸受限、烧结周期长、能耗高等问题,需要探索一种与MAX相金刚石工具结合剂相适应的绿色、节能的
教育发展是区域经济社会发展的基础,教育资源供给的空间格局影响和制约区域社会阶层空间意识形态。基于规划视角,随着规划技术革新,推进了设施空间布局的公平正义研究,但研究切入点多为可达性、设施布局、服务能力等方面;基于社会学视角,研究切入点多从质性研究、统计分析着手,研究成果多集中于社会阶层公平方面。由此,德阳市旌阳区聚焦小学教育资源空间布局公平,以小学教育资源空间布局形态对当下区域学生发展的影响为切入
单分子磁体由于其在高密度信息存储、分子自旋电子学、量子计算等领域的潜在的应用,从而引起了人们的广泛关注。根据单分子磁体载体的类型可以分为离子型单分子磁体、自由基/
研究背景:多发性硬化症(MS)是一种最常见的自身免疫炎症中枢神经系统脱髓鞘疾病,主要是由CD4~+T细胞亚群TH17细胞介导的炎症细胞浸润以及中枢神经脱髓鞘而引起的神经炎症疾病
非线性科学研究被誉为20世纪继量子力学和相对论之后的第三次科学革命,而混沌理论及应用研究是非线性科学的一个重要分支。由于混沌系统对初始条件的极度敏感性,使得混沌系统
拟线性薛定谔方程来源于等离子物理、耗散量子力学等物理模型,关于拟线性薛定谔方程驻波解的存在性及其性质的研究是国内外数学研究者最近几十年关心的热点之一.本文主要研究一类来源于高功率超短激光物质中的拟线性薛定谔方程,需要克服的困难主要是方程对应的能量泛函在通常的Sobolev空间H1(RN)中没有定义,现有的结果主要是利用变量代换和临界点理论考虑非线性项满足(AR)条件时方程非平凡解的存在性.本文将研
深水半潜式支持平台是为海洋石油钻井平台工作人员提供生活和娱乐的平台,机舱作为平台的动力场所,是火灾的高发区,由于平台远离陆地,一旦发生火灾将造成巨大损失。细水雾作为哈龙灭火剂的替代品如今已被广泛应用于机舱灭火系统,其中全淹没高压细水雾系统灭火效率高,经过市场调研和网上搜索,我国尚未有已取的船级社认证并适用于船舶机舱的固定式全淹没高压细水雾系统。本文以某深水半潜式支持平台的机舱作为研究对象,推导了全
金属卡宾介导烯烃复分解反应是一类碳碳双键或三键之间的重排反应,由于其反应条件温和、产率较高,官能团能适应好等特点,在石油、医药、农业、制药、聚合物和材料化学等领域
近年来,光纤通信技术在我国数据通信网络中占有重要地位,因为光纤通信具有传输容量大,传输距离远等特点,而得到了很好的应用。但是光纤在传输过程中会由于模式色散和波长色散等因素的影响而产生色散效应,光纤的色散影响和无线通信中的多径干扰很相似,而多径干扰的问题可以由已经很成熟的正交频分复用技术消除,所以在光纤通信系统中引入了正交频分复用技术受到人们的关注,并最终形成了光正交频分复用(OOFDM)的技术。光