论文部分内容阅读
数字信息的爆炸性增长促使大规模存储系统的出现,磁盘以其大容量和低价格的优势成为数据存储的主要媒介。大量磁盘被组织起来以构建高性能、高可靠的海量存储系统。磁盘的机械特性使得磁盘存储系统成为数据中心能耗最主要的来源之一,能耗成本在数据中心总拥有成本中占据越来越高的比例,因此降低磁盘存储系统的能耗是降低数据中心总能耗进而降低其总拥有成本的关键。磁盘的工作状态被分为活动、空闲和待机三种,磁盘响应I/O请求时必须处于活动状态。磁盘阵列的数据布局方式决定了到达每个磁盘的I/O请求的空间分布,进而决定了每个磁盘的工作状态和能耗。已有磁盘阵列数据布局方式要么未考虑存储系统的能耗,要么在降低存储系统能耗的同时在性能、可靠性等方面存在诸多不足。将固态盘引入存储系统虽然在随机读性能、能耗等方面能有明显的改善,但其物理特性又决定了其在小写性能和可擦写次数等方面存在天生的不足。因此,对磁盘阵列上的数据布局方式进行优化以构建高性能、高可靠、低能耗的海量存储系统是一项重要而紧迫的任务。传统的日志数据分布方法将日志数据集中于专用日志盘上,使镜像盘周期性地切换到待机状态以节能,然而专用的日志盘使得存储系统存在单点失效、性能瓶颈和高能耗的问题。为此,提出了一种日志数据旋转分布方法RoLo和相应的分散式同步方法。RoLo将RAID10系统中镜像盘上的空闲空间组织成一个逻辑的日志空间池,通过将所有镜像盘的空闲空间轮流做为值日日志空间,并利用分散式同步将已使用的日志空间回收并重复利用,在有限的镜像盘空闲空间上构建一个逻辑上无限容量的日志空间。日志数据旋转分布方法未引入额外的日志磁盘,消除了传统日志数据分布方法下的性能瓶颈和单点失效瓶颈;相对较大的日志空间降低了磁盘启停的频率,不但延长了磁盘的寿命,也降低了存储系统的能耗。性能评估结果表明,日志数据旋转分布方法较RAID10节省高达47.2%的能量,较采用了传统日志数据分布方法的GRAID节省高达11.8%的能量。传统的文件分布方式大多仅利用文件访问的时间局部性或空间局部性将文件集中于少量的磁盘上,而未充分挖掘和利用文件访问的双峰分布特点以及固态盘和磁盘之间在性能、可靠性和能耗方面的互补性来优化文件的布局。为此,提出了一个动态数据重分布方法LoRo来进一步降低由固态盘和磁盘构成的混合盘阵的能耗。LoRo利用存储系统I/O负载的局部性和双峰分布特点,将读请求定向到在随机读性能和能耗两方面均具有优势的固态盘上,而将写请求定向到在顺序写性能方面具有优势的磁盘上。动态数据重分布方法LoRo能够在降低混合存储系统能耗的同时提高性能。性能评估结果表明,动态数据重分布方法LoRo相较热点数据集中方法PDC可节省高达68.2%的能量。通过将部分磁盘上的数据全部复制到其他磁盘上,使得部分磁盘切换到低能耗状态可以节能。但单存储卷基于数据复制的数据分布方法的节能效果不但受制于空闲存储空间容量,而且受制于存储负载强度,二者相互制约,限制了存储系统的节能。为此,提出了低能耗多卷文件分布优化方法AdapMig。其周期性地对多个存储卷上的文件进行重分布,最小化多个存储卷的总能耗,同时保持多存储卷的响应时间在预定的阈值之内。低能耗多卷文件分布优化方法首先对多卷文件分布进行建模,对文件的访问负载进行统计和预测,利用遗传算法对所设定的最优化目标进行求解,从而确定新的文件分布方式。低能耗多卷文件分布优化方法能够有效利用多存储卷上的空闲存储空间,在多存储卷内优化数据分布。实验结果表明,AdapMig较未采用多卷之间文件分布优化的PARAID可节省高达26.3%的能量。