高能物理海量存储系统的分布式元数据管理技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xl122700059
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新一代高能物理实验产生了海量的数据,这些数据的存储和高速访问对海量存储系统在可用性、可扩展性及IO访问性能上提出了新的挑战。元数据管理是海量存储技术的研究热点,它对海量存储系统在可扩展性、可用性及高效性方面起着十分重要的作用。为有效管理海量存储系统的元数据,实现数据的高效存取和定位,论文研究了分布式元数据管理系统及其关键技术,设计了新型动态可扩展的分布式元数据管理系统StarFS,并在Gluster开源框架的基础上进行了实现,旨在解决高能物理海量存储系统的元数据性能和可扩展性问题。本研究主要内容包括:  ⑴元数据信息的存储和分布策略。本文对海量存储系统的元数据管理问题进行分析研究,提出了一种自适应目录子树划分的元数据分布算法(ADSP)。算法将文件系统的层次逻辑空间,以目录为粒度划分为一个个子树,子树在存储设备上以扁平化结构存储,利用扩展属性记录子树的元数据分布信息和文件属性,子树根据元数据服务集群的负载情况自适应调整,实现元数据服务集群的负载均衡和动态扩展。ADSP算法是一种改进的子树划分算法,既有静态子树划分算法的实现简单、计算复杂度低的优势,又克服了动态子树划分算法复杂,开销大的不足,实现更为灵活的元数据管理,提高系统的可扩展性。  ⑵数据存储和定位算法研究。本文针对海量存储系统的动态可扩展和数据高效定位的问题,提出了分布式统一布局算法(DULA),实现数据的均匀分布和数据的高效定位。该算法是一种改进的一致性哈希算法,不需要任何的路由信息,实现一次定位,平均时间复杂度为O(1)。实验说明,DULA算法能实现均匀的数据分布和高效的数据访问。此外,文中提出海量存储系统中哈希算法的三个评价标准,并根据衡量标准对主流的哈希算法从理论和软件模拟两方面进行了比较分析,为DULA算法对哈希算法的选择提供理论依据。  ⑶构建了Key-Value存储结构与逻辑结构的映射,支持文件系统的POSIX语义。文件系统的逻辑结构与数据的物理存储结构的映射是文件系统的关键技术之一。本文基于树形结构的思想,对文件系统的存储结构提出多目录存储方法。一方面,通过唯一标识文件的UUID的哈希值高效定位到具体的目录层次;另一方面,多层目录树的设计能有效防止EXT3/EXT4本地文件系统下单个目录的inode个数过多造成的性能降低。  ⑷提出了软硬件相结合的元数据服务的可靠性方案。硬件方面,磁盘RAID技术和双机热备技术相结合,避免硬件故障引起的系统不可用;软件方面,采用远程备份和数据副本技术,并针对副本的放置问题,提出多哈希副本分布算法,解决元数据集群中数据丢失的问题,实现元数据集群的负载均衡,从而提高数据的可靠性和系统的可用性。
其他文献
安全存储系统为存储的数据提供保密性和完整性,防止对数据进行未经授权的访问和修改,同时也为授权用户提供了便捷的文件共享机制.安全存储在电子商务、电子政务、公共远程存
该文研究和探讨了如何使用Windows DNA来设计和实现具有良好可扩展性的药房管理系统.基于COM的组件化程序设计方法继承和发展了面向对象程序设计方法,它是提高软件质量和软件
该文首先介绍了PDM(Product Data Management)的发展过程,并重点介绍了PDM的第三代产品CPDM(collaborative Product Definition Management),PhosphorPDM系统接受协同的产品
论文在分析IP网实时教学系统需求的基础上,提出了Smart-RealClass系统的功能目标、网络模型和层次框架结构,并在其中采用了组播数据跨网段传输、镜头焦点交互和QoS控制等机制
该文在统计方法框架下主要研究汉语句法分析中存在歧义问题.为了降低问题的复杂性,提高分析的效率,该文将汉语句法歧义消解问题分解为词语边界识别问题、词性标注、词义标注
随着数字化时代的到来,办公自动化也越来越普及,作为办公自动化载体的数字纸张逐渐成为研究的热点,目前数字纸张在内容表达上已经能够基本满足办公的需求,但无纸化的梦想却一直没
人类对于计算机的应用,就是利用编写程序控制计算机的强大功能以达到自己的目的,而编译程序完成将编程语言描述翻译成机器语言的工作,起到了人类与计算机交流中的桥梁作用.该
面对海量的半结构化信息,如何从中发现有价值的信息或知识,对内容信息实现有效的抽取和包装,并通过数据仓库进行管理,已成为一项非常艰巨的任务,是实现基于内容的数据管理和数据仓
近年来针对网络协议的攻击行为越来越多,网络协议分析成为网络入侵检测中的一种关键技术,当前主要方法是对网络层和传输层协议进行分析.而随着网络应用的发展,针对应用层协议
航天测控(TT&C)主要实现对航天器飞行轨道、姿态以及星上载荷工作状态的测量监视与控制,它是航天工程不可或缺的一部分。遥测作为航天测控的核心分系统,主要协助用户获取到航天