基于图嵌入社会化推荐算法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:high
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据技术的兴起与普及,现如今社会已迈入数据量呈几何式增长的时代。无论对于信息产出方,还是对信息受用者,都遇到了巨大的机遇和挑战。因此,如何把握好用户的偏好推荐,以及挖掘用户潜在兴趣关联信息,已成为学术和工业界研究的热点领域。随着互联网时代的来临,为解决信息过载问题,搜索引擎应运而生,它利用搜索关键词找到用户所需信息。但搜索引擎需用户主动提供关键词来寻找所对应信息,这种方式存在无法匹配用户其他潜在需求的问题。推荐系统通过分析用户的历史行为,构建用户的偏好模型,解决了信息过载和用户需求不明确问题,从而达到主动推荐用户满足他们兴趣和需求信息的目的。矩阵分解,作为传统推荐系统的核心技术之一,主要旨在学习一种有效的预测函数,以表征用户与项目之间的交互记录(用户-项目评分矩阵),由于其稳定的预测性能以及灵活的扩展能力,一直以来都是学术界和工业界研究热点。但其推荐性能受限于固有稀疏性和冷启动问题。目前主流的解决思路是利用用户间的社交网络信息弥补用户-物品交互数据。然而,由于社交网络数据的复杂性,现有结合社交信息的推荐算法多为启发式方案,未能充分挖掘社交网络数据的有用信息以辅助推荐任务。值得庆幸的是,图嵌入算法的诞生,成为社会化推荐算法重要思路之一。它旨在低维稠密的向量空间中,嵌入高维稀疏社交特征向量,同时将原始网络的结构信息最大化。从这个角度来看,本文以社会化推荐算法为基础,着重研究融合矩阵分解和图嵌入算法方案,提出了协同过滤图嵌入和异构网络图嵌入两种融合方案,本文研究思路如下:首先,针对矩阵分解固有的数据稀疏性问题,本文提出了一个通用框架来集成三种常用的协同过滤方法Tr CF,通过整合三种协同过滤算法的优点,来增加模型的灵活性,对不同应用场景均能提升性能。然后利用图嵌入技术提取用户反馈中潜在而且可靠的社交朋友信息,并根据用户之间的相似性计算得到每个推荐用户的top-k语义朋友,最后将top-k语义朋友信息合并到Tr CF的框架,以此来缓解冷启动问题。其次,为了进一步缓解评分数据与社交网络数据的稀疏性,本文提出使用基于异构信息网络推荐算法来挖掘更加可靠的用户关系。其原理是将整个系统建模为异构网络(由用户项目关系和用户社交关系组成),然后通过精心设计的元路径嵌入表示学习用户的相似性。但是由于过于依赖显式元路径和嵌入表示方法单一,导致用户和项目的潜在信息无法被有效挖掘。然后,针对推荐任务与社交信息未达到有效融合问题,基于HIN推荐技术提出一种新颖的推荐算法,称为HIN-MF。其基本思想是从HIN获得嵌入表示后,提出了三种融合函数对学习到的节点表示进行转换,最后集成到传统推荐算法,矩阵分解模型之中。最后,在三个真实世界的数据集上进行的大量实验证明了两种融合模型的有效性,有效的缓解了数据稀疏性和冷启动问题,也充分说明所提出算法的有效性和合理性。
其他文献
家庭医生签约服务是在人口老龄化、慢病患病率不断增加、居民对于医疗服务需求增长等前提下应运而生的,主要是为了实现人人享有基本医疗卫生服务、维护人民群众健康。重庆市九龙坡区家庭医生签约服务在具体实施过程中还存在一些问题,使得家庭医生签约服务的效果未能达到预期期望。本次主要围绕影响九龙坡区家庭医生签约服务中居民知晓度、满意度等维度的相关因素进行调查研究,利用文献分析法,梳理目前国内外对家庭医生的一些研究
目的:探讨炎症指标中性粒细胞与淋巴细胞比值(neutrophil to lymphocyte ratio,NLR)与朝、汉族原发性高血压患病的关系,为防治本地区高血压病提供参考依据。方法:收集2019年8月-2019年12月在延边大学附属医院体检科体检的原发性高血压患者227例,其中朝鲜族102例,汉族125例;另收集体检健康者255例作为对照组,其中朝鲜族124例,汉族131例。记录各组人群的一
地球参考框架是由一组固定在地球上的地面站的坐标和速度组成的地球参考系统的实现,这组坐标及其速度隐含了定义一个地球参考系统所必须的原点、尺度、定向及其随时间的演变。目前由国际地球自转和参考系服务(IERS)发布的国际参考框架(ITRF)是精度效果最好的地球参考框架。而地球定向参数(EOP)是反映地球自转轴空间运动、本体运动和地球自转速率变化的定量参数,也是天球参考架与地球参考架之间的关键转换参数,其
随着H市经济的快速发展及城镇化进程的加快,H市经济飞速增长。经济快速增长的同时导致空气质量日益恶化,对人民的工作、健康、生活均产生了不良影响。且从全球的环境问题来看
由于现实世界的地理空间数据存在着人为可控程度低、成分复杂等问题,使得研究人员不能深入地进行空间统计与回归分析研究。有时即使勉强进行了相关的研究,所得出的结论可靠性
结核病(Tuberculosis)是一种慢性消耗性传染病,每年引发全球200万人死亡。结核病的病原菌主要为结核分枝杆菌(Mycobacterium tuberculosis)及牛分枝杆菌(Mycobacterium bovis)。牛结核病是一个影响经济和动物健康的重大问题,同时也对人类健康造成了人畜共患病的威胁。据估计,全世界牛结核病的患病率为9%,尤其发生在发展中国家。牛结核病对动物生产性能及牛
随着现代城市的发展,产生了越来越多的废纸类的废弃物。为此,开展对废纸浆的资源化利用,研究废纸浆在非造纸领域的材料化利用具有重要意义。近年来,研究人员开发了几类木质纤
导弹作为当今国家军事的重要力量,尤其是潜射导弹在海上的作战力量,拥有无法比拟的重要性、强大的破坏性和威慑力,所以研究导弹出水过程是否会遭到流场的作用力而导致破坏是非常重要的,但由于导弹试验性价比很低,所以通过有限元去模拟导弹出水情况是十分必要的,不仅周期短,精度高而且减少了人力物力的浪费。导弹出水分为三个阶段,通过对三个阶段的有限元分析可以了解导弹受到的压力载荷的分布及大小,从而判断导弹强度是否足
铸锭/铸件的宏观偏析研究是铸造领域的热点问题,也是难点问题。纵观宏观偏析研究历程,数值模拟已经成为当前预测铸锭宏观偏析的主流,对于深刻认识凝固过程中微观组织的形成以
无线信道建模一直是无线通信领域的重要研究课题,任何通信系统的性能均受到信道特性的影响。近年来,大量的信道测量表明,无线信道的多径分量(Multipath Component,MPC)在实际环境中往往呈现簇结构分布的特点。为了平衡信道模型的复杂度与准确性,基于簇结构的模型成为了当前信道建模的主流思路。在视距与非视距传播场景中,MPC的分布特性具有较大的差异,信道也表现出不同的统计特性,因此,视距和非