由应用驱动的数据中心流调度策略

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lwb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
保证延时敏感型应用产生的流量的低延时和最小化吞吐密集型应用产生的数据流的平均流完成时间是数据中心内性能优化的两个重要指标。现有的方案通常只优化了其中一个指标,或是需要假设相关数据流信息已知。但在很多应用中,数据流信息很难在数据传输结束前获得。所以,我们的目标是要找到一种不需要假设数据流信息就能同时优化两个指标的数据流调度方案。  我们提出了Panda,一种不需要假设数据流信息,而是通过分析运行在数据中心内的应用的流量特征来同时优化两个指标的流调度策略。我们分析了Facebook数据中心内的流量特征后发现,延时敏感型应用产生的数据包大小偏小,而吞吐密集型应用却倾向于产生较大的数据包。所以,Panda根据这一特性对两种应用产生的流量进行区分。Panda的核心思想是,找到一个最优阈值,根据大小将数据包分成大包和小包,保证小包在延时敏感型应用中占主要部分,而大包则主要集中在吞吐密集型应用中;然后为每条数据流分配一个计数器,当数据包到达时,更新计数器的值:如果数据包为大包,增加计数器的值,否则减小计数器的值;之后根据计数器的大小为数据流分配优先级;最后配合多优先级队列,使得延时敏感型应用产生的数据流一直处于高优先级队列,从而保证其低延时,而吞吐密集型应用产生的数据流的优先级则随着其已经发送的数据量的增加而逐渐降低,从而近似实现了短流优先策略,优化了其平均流完成时间。  我们在Linux平台上实现了一个Panda的原型系统,并评测了其性能。实验结果显示,Panda能有效保证延时敏感型应用的低延时要求。与PIAS比较,当延时敏感型应用产生的数据流大小较大时,Panda能降低其请求延时的99%分位值的50%左右,并能同时保证与PIAS基本一致的平均流完成时间优化性能。
其他文献
随着计算机技术的迅速发展,特别是网络技术的发展,计算机的应用越来越广泛和深入。各种旧有应用不断扩充,新的应用不断增加,各IT部门面临的问题也越来越多。诸如不同的硬件平台、
数据仓库已被成功的应用到辅助决策中.对于地理上分布的应用和移动应用,可以由中心数据仓库来处理,但是这样可能造成中心数据仓库的过量负载.随着网络的发展,可以在数据仓库
为了获取高效的BP网络学习系统,我们对于BP网络的结构以及影响网络学习性能的其它相关因素进行了探讨.特别的是,我们对于BP网络训练技术作出了进一步的分析与设计.BP算法引入
信度网推理是信度网研究的主要任务之一.目前应用较广的是联合树算法和桶消元算法.联合树算法的主要缺点是空间复杂性高、计算效率低.该论文对其进行了改进,提出了一个新的信
学位
目前,如何简化应用程序开发流程、降低开发成本、提高效率并开发出可伸缩性、可用性、安全性好的应用程序变得尤其重要。Windows DNA是微软的多层分布式应用程序开发平台。它
当前互联网路由体系面临着可扩展性和无法有效支持移动网络的问题。其根源在于现有网络架构中IP地址存在语义过载问题,被同时用作主机身份和网络路由标识。为解决该问题,位置身
在Web迅猛发展和半结构化信息急剧膨胀的今天,Web上的半结构化数据查询日益成为信息技术领域一个重要的研究发展方向.现有的一些Web查询语言在数据模型、查询方式、路径匹配
该文以Z测试规格说明作为推导测试用例的依据,探讨了从Z测试规格说明推导出测试用例的过程、方法和技术.所谓测试规格说明,是指从规格说明中的输入变量前置条件表达式、输入
近年来,云计算作为一种新兴的计算模式,它已经逐渐成为学术界和工业界最热门的研究领域。云计算具有超大规模、虚拟化、数据存储可靠、高度共享、可扩充以及廉价等特点,它的飞速