基于AWS GPU集群的协同过滤算法的研究及应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：xiongyongdezhanghao

【摘要】

：

移动互联网的高速发展,加剧了互联网的信息过载,用户很难从海量的数据中获取自己感兴趣的内容,个性化推荐系统可以缓解大数据给用户带来的选择压力。协同过滤算法是个性化推

【作者】

：

沙章利

【出处】

：

大连理工大学

【发表日期】

：

2015年期

【关键词】

：

个性化推荐协同过滤算法 GPU AWS 集群计算

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

移动互联网的高速发展,加剧了互联网的信息过载,用户很难从海量的数据中获取自己感兴趣的内容,个性化推荐系统可以缓解大数据给用户带来的选择压力。协同过滤算法是个性化推荐领域应用最广泛的算法,然而该算法在处理大数据规模的推荐问题时,计算耗时大,推荐效率低下,且算法的可扩展性差,不能满足现实生产的需要。当前人们主要利用分布式集群的并行计算来提高算法的执行效率,集群计算需要搭建本地的数据中心或者租赁集群服务,集群管理和扩展的成本高。在并行计算领域,GPU由于其高并行、高内存宽带和成本低等特点引起业界的关注。然而单GPU的计算能力有限,在本地搭建GPU集群同样有着可扩展性和集群管理等问题。亚马逊的云计算平台提供了云环境下的GPU集群,与本地GPU环境相比,云GPU集群拥有更高的计算能力,且成本低可扩展性好。因此,本文提出一种基于AWS GPU集群的协同过滤算法,实验证明,AWS GPU集群的计算能显著提高算法的执行效率,与CPU上串行执行相比,本文的算法最高可以获得390倍的加速比。然后本文介绍了在AWS做应用系统的设计的思路,利用本文提出的算法实现了一个阅读类的内容聚合平台,为企业搭建基于云的个性化推荐系统提供了一种可行的方案。本文的主要工作有：(1)针对大数据规模下协同过滤算法的可扩展性差的问题,本文设计了一种基于AWS GPU集群的协同过滤推荐算法的实现方法。本文在设计并行算法的过程中解决了一系列问题包括：AWS上GPU集群中各节点的任务划分问题；各节点计算数据动态传输问题；推荐算法具体过程的GPU并行问题。本文实现在不影响算法精度的前提下提高算法的性能,降低了推荐系统的成本,为普通用户研究并行协同过滤推荐系统提供了一种可行的方法,同时为中小型企业搭建基于云计算平台的推荐系统提供了参考。(2)将本文提出的基于AWS GPU集群的并行协同过滤推荐算法应用内容聚合类应用的个性化推荐系统中。本文通过收集用户对应用的历史操作信息挖掘出隐式的用户-物品评分表,然后将本文提出的算法作为应用个性化推荐系统的核心。最后实现了一个简单的阅读类内容聚应用的个性化推荐系统,为企业参考本文算法搭建基于AWS的个性化推荐系统提供了一种可行的方案。

其他文献

财政国库集中支付问题探讨综述

<正>随着市场经济体制的不断推进,我国财政制度进一步进行改革创新,并引进和吸收国内外的先进的管理理念。20世纪末,推出执行国库集中收支制度。国库集中支付作为国库集中收

期刊

国库集中支付电子化管理直接支付会计核算工作零余额账户预算单位国库单一账户体系代理银行国库集中支付系统授权支付人民银行国库预算编制

论民间信仰对社会主义新农村建设的影响

民间信仰现象在我国历史悠久、根基深厚、影响广泛。能否正确引导和最大限度地调动蕴藏在人数众多的民间信仰群众中的积极因素,最大限度地克服和减少民间信仰活动中的不和谐

期刊

民间信仰社会主义新农村影响

在海外他们这样过新年

文前提要：一转眼又是中国人传统节日――春节了，吃团圆饭、串门、发压岁钱是每个春节的保留节目。看看在海外，他们是如何过年的。　　　　泰国传统的新年即"宋干节"，也叫"泼水节"，是公历的每年4月13日到16日。节日里，人们抬着或用车载着巨大的佛像出游，佛像后面跟着一辆辆花车，车上站着化了妆的"宋干女神"，成群结队的男女青年，身着色彩鲜艳的民族服装，敲着长鼓，载歌载舞。在游行队伍经过的道路两旁，

期刊

传统节日泰国朝鲜日本新加坡越南

赤峰市住宅小区物业管理中存在的问题及建议

<正>随着城镇住宅商品化的不断深化,与之相适应的物业管理作为专业化、社会化的房屋管理形式已成为社区建设、城市管理不可或缺的一部分。但是,我们在肯定物业管理取得成绩的

期刊

住宅小区物业管理业主委员会物业服务企业公用事业单位业主大会物业服务合同问题及建议

关于农村饮水安全问题的几点探讨

我国农村饮水安全问题十分严重,主要表现为饮用水质超标、缺水问题严重、水污染恶化、供水设施效率低下和行政管理服务滞后5个方面。目前政府对3亿多农民饮水不安全现状十分

期刊

农村饮水安全探讨

恩替卡韦、干扰素治疗HBeAg阳性慢性乙型肝炎患者肝组织内HBV cccDNA变化差异及相关性分析

目的定量检测肝组织内HBV cccDNA、总HBV DNA及血清总HBV DNA,分析干扰素、恩替卡韦治疗对肝组织内HBV cccDNA的影响。方法从慢性乙型肝炎抗病毒治疗研究中选择40例HBe Ag阳

期刊

恩替卡韦干扰素HBV cccDNA

斜滑断层的成因及其沉积响应——以渤海湾盆地济阳坳陷为例

斜滑断层是一种重要的构造变形,断层的斜向滑动导致盆地发生斜向裂陷作用,并在一定程度上控制着盆地内的沉积体系。在系统分析斜滑断层的变形机制的基础上,将斜滑断层的成因

期刊

斜滑断层成因机制剪切变形沉积响应济阳坳陷渤海湾盆地

不同秸秆利用方式下江苏滨海盐碱地盐碱障碍调控

江苏省拥有的丰富的沿海滩涂资源,是不可或缺的后备土地资源。由于自然和历史原因,沿海滩涂因盐渍化问题一直无法直接进行农业开发利用。针对滨海盐碱地土壤盐渍化障碍,对比

期刊

滨海盐碱地盐碱障碍土壤改良秸秆综合利用

滨海盐碱地改良增产技术

<正>1技术概述选用抗旱耐瘠薄且综合表现较好的作物品种,是滨海旱碱区粮食增产的关键;通过挖排水沟,建立完善的排灌系统,充分利用雨季降水通过深沟淋盐碱,降低地下水位,可有

期刊

盐碱地改良化肥使用化学改良剂盐分浓度改良盐碱地

构建《历史与社会》“问题导引式”课堂教学模式——浙江省《历史与社会》“综合性学习”课堂教学模式探索

初中《历史与社会》“问题导引式”课堂教学模式是浙江省教研室初中《历史与社会》“综合性学习”课堂教学模式研究总课题的一个子课题,本课题的研究工作秉承“以学生全面发

期刊

问题导引导趣导疑导思导创导评

基于AWS GPU集群的协同过滤算法的研究及应用

其他学术论文