一种结合硬件特征的并行内存故障检测方案

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:bencui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着存储技术的不断发展,内存芯片的面积越来越小,容量越来越大,密度越来越高,内存单元发生故障的概率也随之越来越大。根据故障模型,人们设计了许多内存检测算法,其中最为常用的、故障覆盖率最好的是March类算法。为了能够检测到各种故障类型,March算法被设计的越来越复杂,检测时间成倍的增长。另外,所有的算法都是被设计用来检测一个内存芯片内部的单元是否存在故障,他们更适用于在工业制造中对内存条出厂前的检测,并不适用于用户对计算机内存的检测。针对以上问题,提出了一种结合硬件特征的并行内存故障检测方案,它能够有效地解决上述两个问题:既可以成倍的降低March算法的检测时间,又能让用户利用March算法在短时间内对内存进行检测。该方案包含两种并行内存检测方法:一个是根据DDR2的结构和工作原理而设计的芯片级并行,可以并行检测一个DDR2内部的多个内存芯片;另一个是根据访存控制器的结构和工作原理而设计的访存控制器级并行,可以并行检测多个DDR2内存条。实验表明:对于芯片级并行,访存带宽越大(即并行检测的芯片个数越多)并行效果越好,从一个芯片到并行检测8个芯片,内存的检测时间几乎是成线性递减的。对于访存控制器级并行,访存控制器数量越多并行效果越好,从一个LMC到2个LMC,内存的检测时间几乎减少了一倍。
其他文献
  Web服务非功能属性评估是服务选择的重要前提,而目前的服务评估方法没有根据各非功能属性内在特征进行其属性值的评估,也没有考虑用户对多个属性的复杂需求,无法有效的选
会议
  MapReduce任务负载均衡主要是通过分区函数来实现的,Hadoop默认的分区函数并不能很好保证reducer的负载均衡。本文针对周期性的业务处理提出了一种基于权重计算的负载均
会议
  进行试验弹对钢靶的侵彻研究并获得侵彻过程中的过载和侵深是保证装药稳定性和引战系统可靠性的关键因素。但以往研究多将试验弹内部的引信结构简化,本文建立引信部位不同
  嵌入式存储体目前已经广泛用于芯片设计,对于很多芯片而言,片上存储体是影响芯片成品率的主要因素,在某芯片内集成了大量的定制存储体D_MM,本文采用内建自修复和存储体冗
  单机运行环境难以满足海量空间数据的连接聚集操作对时空开销的需求,集群上的并行计算是高效处理海量空间数据的连接聚集操作的关键。Map-Reduce是云计算中—种应用于大规
会议
  本文说明了如何利用三维并行自适应有限元软件包PHG求解生物分子溶液体系的非线性Poisson-Boltzmann方程及电扩散方程,并介绍了一种解决这类问题的新方法,它将网格生成与自
会议
  中科院超级计算环境是整合了包括总中心、分中心和所级中心计算资源的三层架构超级计算环境。为提升超级计算环境的可靠性,提供稳定可靠的计算服务,其容错机制的研究成为超
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
  并行程序在运行过程中,位于计算节点上的进程经常由于CPU要处理来自硬件、固件、节点操作系统、系统管理软件等部件的干扰而被迫中断,这些由于系统部件所引起的计算进程
会议
牛奶含有多种营养成分,尤其是维生素A,在牛奶里含量较高。而米汤、米粥这些以淀粉为主的食物,含有一种脂肪氧化酶,会破坏维生素A。据试验,牛奶兑上米汤后分别置于冷藏、常温