多核集群中系统噪音的测量

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:hexqi666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  并行程序在运行过程中,位于计算节点上的进程经常由于CPU要处理来自硬件、固件、节点操作系统、系统管理软件等部件的干扰而被迫中断,这些由于系统部件所引起的计算进程中断被称之为“系统噪音”.相关研究表明,噪音的叠加对大规模并行程序的性能有较大影响,特别是当前的大规模集群系统,单节点数十核、全系统数万核,需要对系统噪音进行精确的量化分析.本文在总结相关研究的基础上,实现了一个低开销、可扩展性好的噪音测量软件NoiseProfiler.该软件实现固定工作量、固定时间量、噪音序列三种噪音测量方法,能够从不同视角刻画系统的噪音特征;实现单核、单CPU、全节点三种测量流程,分别针对多核集群系统的多种使用模式;低时间开销,在2000个节点上测量时间最长1458秒;具有良好的可扩展性,节点数量从125增加到2000,其测量总时间仅增加3.9%.应用到某单位生产系统P上,检测到P内存在两类较大噪音源,通过改进系统、消除噪音源,实际并行程序的测试性能分别提升38.5%、48%.
其他文献
  在列数据库中,连接操作依然是最核心和最耗时的操作,GPU 强大的计算能力可为此提供新的优化手段.基于Fermi 架构,文中提出了新的Hash Join 算法和Sort-merge Join 算法,
会议
  高性能计算是支撑国家实力持续发展的关键技术之一。论文首先分析高性能计算面临的问题,指出传统高性能计算程序性能优化技术的不足。接着介绍了面向高性能计算程序性能优
  Web服务非功能属性评估是服务选择的重要前提,而目前的服务评估方法没有根据各非功能属性内在特征进行其属性值的评估,也没有考虑用户对多个属性的复杂需求,无法有效的选
会议
  MapReduce任务负载均衡主要是通过分区函数来实现的,Hadoop默认的分区函数并不能很好保证reducer的负载均衡。本文针对周期性的业务处理提出了一种基于权重计算的负载均
会议
  进行试验弹对钢靶的侵彻研究并获得侵彻过程中的过载和侵深是保证装药稳定性和引战系统可靠性的关键因素。但以往研究多将试验弹内部的引信结构简化,本文建立引信部位不同
  嵌入式存储体目前已经广泛用于芯片设计,对于很多芯片而言,片上存储体是影响芯片成品率的主要因素,在某芯片内集成了大量的定制存储体D_MM,本文采用内建自修复和存储体冗
  单机运行环境难以满足海量空间数据的连接聚集操作对时空开销的需求,集群上的并行计算是高效处理海量空间数据的连接聚集操作的关键。Map-Reduce是云计算中—种应用于大规
会议
  本文说明了如何利用三维并行自适应有限元软件包PHG求解生物分子溶液体系的非线性Poisson-Boltzmann方程及电扩散方程,并介绍了一种解决这类问题的新方法,它将网格生成与自
会议
  中科院超级计算环境是整合了包括总中心、分中心和所级中心计算资源的三层架构超级计算环境。为提升超级计算环境的可靠性,提供稳定可靠的计算服务,其容错机制的研究成为超
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊