基于用户协同过滤推荐算法的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lingling850502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“互联网+”的蓬勃发展和大数据时代的来临,网上购物已经成为人们日常生活的重要组成部分。如何快速有效的解决数据的搜索、分类、推荐,成为摆在人们面前亟需解决的问题。推荐系统能够根据用户的个人偏好,向用户提供个性化的服务推荐,从而使得广大用户能够迅速且准确地找到自己满意的商品或服务。尽管推荐系统近来取得了长足进步,但随着互联网用户数量的急剧增长,以及移动互联网的快速发展,推荐系统存在的缺陷和不足,更加制约着推荐系统的健康发展。本文针对基于用户协同过滤推荐系统所面临的稀疏性、扩展性、冷启动问题,通过将奇异值分解与聚类融合,并针对基于用户协同过滤推荐系统的特性,改进了相似性度量公式与Top-N推荐权值赋值系数,提出一种融合奇异值分解和聚类的协同过滤推荐算法—SCW(SVD Clustering Weight)算法。SCW算法主要融合了奇异值分解降维、聚类和Top-N推荐三个原理。具体研究内容可概括为以下几个方面:首先,本文利用奇异值分解从Movielens数据集中构建一个主题空间,然后在该空间中计算相似度。其次,对降维后的评分矩阵中的用户进行聚类,聚类分析将数据划分成有意义的簇。最后,完成聚类后,按照用户聚类的每个簇都是行为模式相似的用户,遍历目标用户所在簇的其他用户的物品集,去除目标用户物品集生成推荐列表。然后利用改进的预测评分公式计算推荐列表物品的预测评分,排序推荐。本文利用Moivelens公开数据集进行实验验证,并将本文的提出算法与传统的基于皮尔森相关度协同过滤算法和主成分分析算法进行对比。实验结果表明,本文提出的算法能够有效完成个性化推荐,提高了推荐准确率并降低了预测评分值的绝对值误差,在一定程度上解决了基于用户协同过滤推荐系统中存在的稀疏性、扩展性与冷启动问题。
其他文献
本文对3β--羟基莪术醇衍生物抗单纯疱疹病毒体内药效和云南蜱样本宏基因组进行了分析。本研究分为两个部分:   第一部分:3β-羟基莪术醇衍生物抗单纯疱疹病毒体内药效研究
β-FeSi2具有很高的光吸收系数(光子能量为1.0eV时,光吸收系数大于105cm-1),被认为是一种新颖的光伏材料,理论上光电转化效率可以达到16[%]-23[%]。但是关于β-FeSi2材料的研究还
工业革命以来,人类排放二氧化碳等温室气体造成近百年来全球气候与环境的持续变暖.最近60多年来全球的升温趋势尤其明显,其中,北半球比南半球的变暖更显著,我国东部海域升温
期刊
森林是陆地生态系统最大的有机碳储存库,在全球碳循环方面起到重要作用。采伐是人类经营森林的主要手段,合理采伐有利于森林有机碳吸存。但是,森林采伐导致大量地面生物量被移除
杆状病毒是研究大ds DNA病毒进化和多样性的模型之一,随着杆状病毒全基因组序列的增加和比较基因组学、系统进化学以及生物信息学的发展,对杆状病毒基因组结构和进化研究都取得
水检气密性检测方法因其简单快捷、精度高的优点在生产生活中发挥着重要的作用,依靠人眼观察的传统水检方法已无法满足经济发展的要求,需要简单有效的气泡探测方法。光散射成
时间序列是对某个物理量进行等时间间隔观测所得的数值序列,能够反映受监测事物的状态、状况。时间序列的异常检测方法能够检测出时序序列中的异常,同时能够评价异常的程度,帮助
随着人们对传感技术集成化、小型化、网络化等发展方向的要求,光纤传感技术以其体积小、重量轻、抗电磁干扰、复用能力强、长期稳定性好等优点而得到了广泛的关注。光纤激光
编者按:“松窗采薇——溥心畬绘画作品展”于2013年10月25日在北京画院美术馆隆重开幕。此次展览汇聚了溥心畬作品100余幅。包括其早期、去台湾前与去台湾后的作品,部分作品
本文主要以瀚瑞微电子有限公司的一款模拟源驱动芯片PIX82720TC设计工作为基础,利用现有的测试和可测试性设计技术,结合TFT(Thin Film Transistor)-LCD驱动芯片的特点提出一套