基于矩阵分解的个性化推荐算法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:vitaminchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐通过收集和分析用户显式或隐式的有效信息,从而为用户推荐所需要的个性化信息,进而能够很好地解决信息过载问题。基于矩阵分解的推荐算法是目前个性化推荐的前沿重要研究热点之一,为了减少用户评分项目稀疏性对最终推荐精度不高的影响,本文从以下几方面展开研究:  (1)在对协同过滤算法、矩阵分解技术和社交网络的信任关系的国内外研究现状进行阐述的基础上,深入研究和分析了基于矩阵分解的个性化推荐算法的基本原理、基本方法、评价指标以及改进相关算法的依据和思路。  (2)提出一种将正则化的矩阵分解技术和社交网络信任模型相结合的协同过滤算法 MF&MT-CF( A Collaborative Filtering Algorithm Merging the Matrix Factorization and Muti-path Trust Degree)。首先在信任度计算方面,引入专家节点的方法来确定两个非相邻节点之间存在多条路径信任度的选择问题;同时为了提高用户—项目评分矩阵的预测精度,在矩阵分解的基础上引入正则化的方法。接着将多路径信任度矩阵与通过矩阵正则化后获取的用户—项目评分相似度进行融合而做出评分预测。最后在经典的MovieLens数据集上对本文提出的算法通过RMSE(Root Mean Square Error)值进行验证和对比,结果显示本文提出算法的推荐精度明显优于与传统算法。  (3)鉴于具有相似属性的项目之间的潜在因子向量也具有相似性,提出一种融合用户项目偏置信息的概率矩阵分解算法IAR-BP(Item Attribute Regulation with Bias Probabilistic Matrix Factorization)。该算法首先将相似项目的潜在因子向量的差值作为一种非线性正则项来约束传统的概率矩阵分解,同时考虑到同一项目有多种不同的属性,而且为避免共同属性少而相似性高的问题,通过拉普拉斯平滑修正项目之间的相似性度量方法作为权重来约束项目的分解,然后将用户项目偏置信息融合到改进的概率矩阵分解中以提高推荐精度,最后在真实数据集上的实验结果表明本文提出的IAR-BP算法相对于传统的概率矩阵分解算法不仅收敛快而且收敛精度高。  将本文中上述提出的两种改进的矩阵分解算法(MF&MT-CF和IAR-BP),从实践的角度来基于Spark平台设计并实现了一个基于矩阵分解的推荐原型系统,达到了项目在个性化推荐方面的预期要求。
其他文献
伴随着传感器技术、通信技术和计算机技术的进步,无线传感器网络获得了迅猛发展,应用领域不断拓展,被誉为未来十大新兴技术之首,将对人类的生活和社会生产造成巨大的影响。由于传
很多科学工程计算和数值处理问题可以转化为稀疏线性方程组的求解。对于大规模的稀疏线性方程组的求解,目前使用最广泛且最有效的方法是基于投影的Krylov子空间方法。光滑粒
本文研究了结合AdaBoost和Camshift的视频人脸检测与跟踪算法,针对AdaBoost和Camshift算法的缺点提出了相应的改进算法。首先,研究了基于隐马尔可夫的模型的AdaBoost人脸检测
随着当前无线通信业务的迅速发展,可利用的频带日趋紧张,频谱资源匾乏的问题日益严重。但是研究表明,数量众多的授权频谱在大部分时间处于空闲状态,这种频谱占有状况与利用的不平
自然场景图像中嵌入的文本,是图像高层语义内容的有机组成部分。场景文本有诸多表现形式,如交通标志牌、字幕、商店名称、文本条幅、建筑物额匾等,这些信息可以为场景理解提
粒子滤波算法是一种基于蒙特卡罗方法仿真来实现递推贝叶斯估计的统计滤波方法。作为一种基于蒙特卡罗思想的非线性、非高斯系统滤波方法,粒子滤波在处理非高斯、非线性时变
当前TCP/IP体系结构的互联网存在可扩展性、安全性、移动性等诸多问题,近年来越来越多的网络研究人员投入到未来互联网的研究中。对于所取得的研究成果,研究者可以将其部署在实
信息技术发展十分迅猛,对各种产业都产生了巨大的影响。各行各业都广泛收集了海量的数据。这些数据中蕴涵大量有用的信息和知识。为从这些收集的数据中获取有用的信息和知识,
数字图像因其具有直观、生动等特点而得到广泛应用。但数字图像的另外一面,却会因数据海量给传输和存储带来压力。因此。利用其数据冗余量大这一特征,以压缩冗余数据为主要目标
随着网络负载急剧增加,给网络的结构带来了很大的压力,软件定义网络(software-defined networking,简称SDN)顺势产生。准确的测量网络的性能是保证网络高性能运行的前提。  本研