论文部分内容阅读
性能模型研究一直伴随着存储系统的发展,为存储系统的配置、设计和改进提供了重要基础。IP-SAN逐渐成为重要的SAN构架,数量庞大的存储设备和丰富多样的工作负载使得智能化和自主化的IP-SAN成为研究热点。性能模型是动态调整和自主决策的依据,是智能化和自主化的关键工具。当前大多数的性能模型研究都集中于设备级存储(如磁盘和RAID),系统级的IP-SAN性能模型仍然缺乏。因此,探索系统级的IP-SAN性能模型对于IP-SAN的研究和发展具有较强的理论和实际意义。
为IP-SAN建立性能模型是相当复杂的,简化复杂性与保证精确度之间的矛盾是建立IP-SAN性能模型的主要矛盾。为此,本文采用排队理论,系统地研究了建立IP-SAN分析模型的方法和技术。本文的主要贡献与创新点如下:
1.以多个客户端共享一个存储节点的IP-SAN基本结构作为分析对象,建立了一种IP-SAN分析模型。该模型采用闭环排队网络和开环排队网络分别分析了同步和异步工作负载下的IP-SAN性能。利用该模型,可以预测各种系统参数值和负载参数值下的IP-SAN响应时间和吞吐量。该模型不仅具有合理的精确度,而且简单实用。在同步负载和异步负载情况下,平均相对误差小于34.3%和25.8%。
2.为了保证模型的精确度,提出了基于模块化的系统级建模方法。该方法包括抽象出系统的理论模型和关键模块,建立各个关键模块的分析模型,并通过验证和修正,再组合成整体模型进行验证。其核心思想是从模块级就开始验证和控制精确度,从而控制整体模型的精确度。抽取出包含网络、Cache、RAID和磁盘等四个关键部件的IP-SAN理论模型,次要部件的影响归入相关的关键部件模型中,从系统层次降低了模型的复杂性。该方法也使得修正或替换某模块模型不影响其他模块模型,因而可以适应更广泛的IP-SAN结构和配置,建立更复杂的IP-SAN模型,从而提高模型的灵活性。
3.提出了基于灰盒方法的磁盘分析模型。该模型不需要了解详细的磁盘内部I/O细节,减少了对专业知识的依赖,以及大量详细参数的获取,也不需要较长时间的培训和典型的培训负载。该模型从模块层次简化了IP-SAN模型的复杂性。
4.提出了基于统计方法的Cache分析模型。利用统计参数描述负载,得到一种新的cache模型。该方法使得模型验证更容易,从而也从模块层次简化了IP-SAN建模复杂性。
5.推导并证明了并发异步I/O流的叠加特性,为IP-SAN开环排队网络模型的IO流特性分析提供支持。此外,给出了NBD、iSCSI和扩展RAID0模型,其中扩展RAID0模型弱化了已有RAID0模型的假设条件。