【摘 要】
:
由于单个数据中心的资源有限,复杂的Spark工作流应用需要在多个数据中心内执行。当输入数据太大而无法传输(不可移动数据)时,依赖该数据的Task只能被分配在该数据所在的数据
论文部分内容阅读
由于单个数据中心的资源有限,复杂的Spark工作流应用需要在多个数据中心内执行。当输入数据太大而无法传输(不可移动数据)时,依赖该数据的Task只能被分配在该数据所在的数据中心执行,然而Spark并不能保证这一分配。另一方面,Spark提供的基于同构的调度策略并不适合于异构环境。本文研究异构多数据中心下带不可移动数据的Spark任务调度问题,以优化Spark工作流应用的完工时间为目标,具有重要实际意义和应用前景。该问题面临的挑战主要包括两方面:(1)部分依赖不可移动数据的任务只能被分配在特定的数据中心执行,这类任务和其它任务在该数据中心的资源竞争将对完工时间造成不利影响;(2)Spark工作流应用的可选Stage调度序列数量巨大,且异构多数据中心环境下关键路径无法获得,很难找到合适的Stage调度序列来优化完工时间。针对所考虑的问题,本文提出了一种基于规则的任务调度算法(STSID)。该算法分为时间参数估计和Stage分配两个阶段。时间参数估计阶段提出了两种Node速率估计方式,根据估计的Stage执行时间求出Stage的各个时间参数。Stage分配阶段分为Stage选择、资源分配和添加就绪Stage三部分。第一部分从就绪Stage集合中选择优先级最高的Stage,采用的优先级规则是:依赖不可移动数据的Stage优先级高于其他Stage,对于其他Stage则提出了ESTF(开始时间早的Stage优先)、SFTF(浮动时间短的Stage优先)和RANDOM(随机排序)三种优先级规则。第二部分提出三种Stage调度算法,分别基于Node最早可用时间优先、Task最早完工时间优先和最小资源浪费优先来调度Stage下的Task。第三部分则将就绪Stage添加到Stage就绪集合中。为验证所提算法的性能,本文采用多因素方差分析技术(ANOVA)对相关参数进行校正,并选择对于解决本文提出的问题的最合适的参数。然后将STSID与Spark提供的FIFO和FAIR算法进行比较。实验结果表明,本文所提出的算法在不同Job数量的工作流实例下和不同Node数量数据中心中的性能优于FIFO和FAIR。
其他文献
近年来,锂硫电池因其在电动汽车、卫星、无人机和其他储能设备上具有广阔的应用前景而受到了越来越多的关注。硫正极具有较高的理论比容量(1675 mAh g-1)和能量密度(2600 Wh
喀斯特石漠化是一种严重的荒漠化,对社会、经济和环境影响较大。中国中西部是重点扶贫的地区,从国家实施西部大开发战略至今,西部依然处于落后地区。西南地区贫困除了当地老
毕赤酵母因其在蛋白表达方面的明显优势,被广泛用于工业生产和实验室研究。近年来,随着合成生物学的发展,已有多种药用化合物或中间体在毕赤酵母中成功合成(如6-甲基水杨酸、
近些年来越来越多研究者将目光集中于微服务。复杂应用大多以科学工作流的形式表示,所以用微服务工作流来表示一组带有偏序关系的微服务任务集合也是各大应用服务提供商构建
随着人类对物理和化学领域研究的深入,激光技术应运而生,进而人们打开了微观的分子和原子世界,分子的荧光性质可应用于光电子器件,例如荧光探针,荧光成像,质子转移激光和有机
当今社会城市化水平不断提高,车辆的数目也随之迅速增长,大量的汽车进入人们的日常生活,同时也带来了交通拥堵、污染等问题。交通流预测作为智能交通管理系统的核心之一,不仅
半导体桥(SCB)是一种新型电火工品。其本身具有一定在电磁环境中的不发火能力,但在日益严苛的电磁环境和安全标准前,SCB火工品对电磁环境的防护能力仍需进一步提高。本文在对不同静电/射频防护器件的优缺点进行分析的基础上,选择同时使用TVS二极管和NTC热敏电阻对SCB火工品进行静电和射频的综合防护。对原有火工品结构进行重新设计,使其在保持体积不变的前提下可以集成TVS二极管和NTC热敏电阻。通过实验
铌酸锂晶体是一种性能优异的电光材料,基于铌酸锂电光效应制成的空间光调制器也一直是一个研究热点,它可以被用来调节光束的振幅以及相位,相较于传统的液晶空间光调制器,电光调制器有着更快的调制速度以及更大的光强承受能力。小规模、紧凑型的电光调制器在过去的数年之间已经快速的趋向于成熟,或许在不远的将来,它们会为在高性能计算,电子模拟电通信网络,以及数据中心中涉及到的相关应用带来较大的革新。本文在一开始概述了
重结晶碳化硅是重要的高性能结构陶瓷和耐火材料,具有优异的热稳定性、高温力学性能、耐磨性、耐腐蚀性等特点,是国防、冶金、耐火材料、车辆工程、陶瓷等行业的首选。重结晶
随着钢材市场竞争日趋激烈,首钢品种钢产量比例大幅度提升后,扩大品种向华中、西南地区推广销售为大势所趋。我国现有华中、西南地区品种钢主要由宝钢、武钢等企业供货。首钢