论文部分内容阅读
数据容量的爆炸式增长,数据价值的日益增加,对存储系统的容量、成本、数据可靠性和数据访问性能等方面提出越来越高的要求。存储架构由传统的集中式存储逐步发展成为集群存储。数据可靠性方面,集群系统普遍采用镜像存储,同时也为此类系统带来高昂的存储开销,另一方面,纠删码存储以其高可靠、低存储开销,成为集群存储系统的一个研究热点。纠删码存储存在传统RAID技术所面临的两个问题,小写更新与Write Hole。 针对这两个问题,本文提出一种多重条带布局的RAID技术,采用纠删码,对外提供N+M的数据可靠性保护级别,降低冗余数据的存储开销;采用同步镜像小写,异步镜像转换纠删码的方式,并且保证转换过程无数据覆盖、无数据迁移,从而有效的解决同步纠删码的小写更新问题;通过纠删码数据块与校验块的非原位更新,避免纠删码的Write Hole问题。另外,通过条带内部的冗余数据轮转分布,实现整个系统成员磁盘的读写带宽均衡,避免冗余磁盘在小写更新时成为性能瓶颈;引入逻辑子卷的重映射方式,能实现系统动态的增删逻辑卷存储空间,达到存储资源的弹性管理。 在多重条带布局的理论基础上,本文设计了一个混合镜像与纠删码布局的Hybrid-RAID原型系统,采用状态位图、纠删码位图、镜像位图和小写位图,以较低的元数据开销,精准定义条带角色;通过变更条带角色,而非迁移数据的方式,实现高效的镜像转纠删码操作;使用操作流水技术,提升系统处理请求的吞吐量。在性能测试方面,Hybrid-RAID系统的顺序小写性能与RAID6相比,平均提升了2.05倍;随机小写与RAID6相比,平均提升6.6倍,从而验证了多重条带布局技术在解决小写更新问题上的有效性。