针对Hadoop异构集群节点性能的数据分配策略

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：standups_wu

【摘要】

：

当前Hadoop的实现主要针对同构集群,假设任务处理的数据基本是本地的.然而,实际应用中集群多为异构.这暴露出现有的数据分配策略对数据局部性考虑的不足,其产生的不必要数据

【作者】

：

林常航郭文忠陈煌宁

【机构】

：

福州大学数学与计算机科学学院,国防科学技术大学计算机学院,

【出处】

：

小型微型计算机系统

【发表日期】

：

2015年01期

【关键词】

：

Hadoop 数据分配数据局部性异构集群

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前Hadoop的实现主要针对同构集群,假设任务处理的数据基本是本地的.然而,实际应用中集群多为异构.这暴露出现有的数据分配策略对数据局部性考虑的不足,其产生的不必要数据传输耗费了大量的带宽资源和传输时间.通过结合Hadoop中数据放置与任务执行的关系,按不同节点对不同任务的执行能力进行数据分配.在考虑异构集群中节点固有性能的情况下,提出一种机架间基于任务特性和节点计算能力的数据分配策略.该分配策略提高了对数据局部性的关注,使每个节点都尽可能只访问本地数据.通过实验可知,该策略可以有效地缩短作业执行时间,提高时效性;同时提高数据局部性,减少网络数据传输,避免拥塞;最后,该分配策略还具有较好的稳定性. At present, the implementation of Hadoop is mainly aimed at isomorphic clusters, assuming that the data processed by the task is basically local, however, in practical applications, the clusters are mostly heterogeneous, which exposes the existing data allocation strategy to consider the lack of data locality. Unnecessary data transmission consumes a large amount of bandwidth resources and transmission time.Based on the relationship between data placement and task execution in Hadoop and data distribution on different nodes according to the execution ability of different tasks.Considering the inherent performance of heterogeneous clusters , This paper proposes a data distribution strategy based on task characteristics and node computing capabilities between racks.This allocation strategy increases the focus on data locality so that each node can access only local data as far as possible.Through the experiment, Which can effectively shorten the job execution time and improve the timeliness; at the same time, improve the data locality, reduce the network data transmission and avoid congestion; finally, the allocation strategy has better stability.

其他文献

黄瓜穴盘苗壮苗指标的初步研究

期刊

湖南省人民政府关于表彰2011年粮食生产先进单位的决定

2011年,在省委省政府的正确领导下,在各级党委、政府和农业等部门的共同努力下,全省＂压单扩双＂、遏制抛荒、控制直播、高产创建等工作取得了明显成效,全省粮食生产再获丰收,总

期刊

粮食生产人民政府湖南省单位国家粮食安全经济社会生产工作省政府

分析绿色可持续发展石油化工生产技术新进展

石油化工行业的出现有效的将我们国家的社会经济水平又提高了一些,但随之带来的最大困扰就是石油化工行业对环境有着严重的影响.为了促进我国社会经济的可持续发展,就必须重

期刊

可持续发展石油化工生产技术绿色生产技术

富硒梨子优质高产栽培技术

梨树是蔷薇科梨属的多年生落叶乔木,果实可食用,生津止渴,清理胃肠积热,《本草纲目》中记载梨果和皮均可入药,有解热、止咳之功效.富硒梨不仅营养丰富,而且医疗保健作用明显,

期刊

富硒医疗保健作用《本草纲目》有效措施营养丰富销售价格生产者农民增收落叶乔木关键技术消费者蔷薇科梨产业多年生总结止咳胃肠市场生

信仰的高度BMW M精神图腾

成立于上世纪七十年代的BMW M GmbH原本是BMW一个专门负责参与赛车运动的部门。几十年间，M成为了一种精神！它在性能车坛奠定经典的地位，使无数传奇故事深刻地烙印在全球车迷的心

期刊

信仰性能赛车运动传奇故事虚荣心攻击性创造力智慧物种玩具潜力民间经典驾驶地位

北信源上网行为管理系统VRV BMG发布

近期,北信源公司推出了自主研发的北信源上网行为管理系统VRV BMG(VRV Behavior Management Gateway).该产品是一款基于内网用户网络行为管理和控制的硬件网关,是北信源公司

期刊

信源上网行为管理系统VRV发布内网安全安全管理体系终端用户用户网络行为管理管理产品公司授权访问控制Management自主研发硬件

从耕地需求底线角度解析甘肃粮食安全问题

利用基于粮食安全的耕地底线对甘肃省1978～2007年的粮食安全进行评估,结果表明,30年来甘肃省的粮食基本处于不安全状态,造成这种结果与耕地数量和粮食播种面积减少、复种指教

期刊

耕地面积变化耕地需求底线粮食安全甘肃省

虚拟机技术在计算机机房管理中的合理运用

日常的教学中,虚拟机技术有着重要的辅助价值,是不可缺失的.从操作角度看,虚拟机技术拓宽了可操控的灵活空间,便于实时的管理.在计算机系统内,虚拟机技术表现出并存及兼容的

期刊

虚拟机技术计算机机房管理合理运用

M新图腾宝马M3/M4

宝马M，在车迷者心中，已然成为图腾的象征，并且“M”也从来没有让大家失望过！“M”生来的使命，就是将性能卓越的宝马M系列，推向一个足以让所有人都仰望的精神境界……。

期刊

精神境界性能图腾使命

针对Hadoop异构集群节点性能的数据分配策略

其他学术论文