论文部分内容阅读
随着大数据时代的到来,数据中心成为数据存储的主要场所,其数据量呈指数级增长,对存储器的需求也大大增加。磁盘存储器具有高密度、大容量、高性价比等优点,是目前数据中心的主要存储设备。然而,磁盘存储器寿命短、故障率高等问题大大降低了数据中心存储系统的可靠性。磁盘故障不仅影响数据中心服务的可用性,还会给数据中心运维带来巨大的开销。因此,研究磁盘故障问题对提升数据中心存储系统的可靠性和减少数据中心运维成本具有重大意义。围绕磁盘故障问题,开展了故障分析、故障预测和故障恢复三方面的研究工作。
在故障分析方面,分析了数据中心环境下磁盘负载对磁盘故障的影响。使用磁盘利用率和磁盘传输速度构建了磁盘负载的时间特征和空间特征,量化了它们对磁盘故障的影响。基于时空特征的分析结果,构造了引发磁盘故障的关键负载特征。除此之外,结合数据中心的实际情况,提供了若干条减少磁盘故障的磁盘负载调度建议。
在故障预测方面,使用检测与修正方法解决了数据中心环境下磁盘故障预测数据的不准确问题。通过分析数据中心的磁盘故障检测方式,揭示了磁盘故障预测数据中的标注不准确问题。根据相关邻域图中的切边加权统计方法与基于磁盘数据中不准确标注的特征修正策略,提供了一种磁盘故障数据中不准确标注的检测与修正方法。
在故障恢复方面,为数据中心解决了有限的故障恢复资源与不断增加的磁盘预警频率之间的矛盾所引发的数据安全问题。通过分析在面对多个磁盘预警时故障恢复资源与预警频率间的矛盾,揭示了数据中心构建实时磁盘故障恢复处理调度策略的迫切需求,并通过预测磁盘故障发生顺序构建了一种高效的磁盘故障恢复处理调度策略。
综上所述,围绕数据中心的磁盘使用特征和磁盘故障特征,从磁盘故障的原因,磁盘故障的预测和磁盘故障的恢复三个方面全面深入地研究了数据中心环境下的磁盘故障问题,增强了对数据中心磁盘故障的规律理解,降低了磁盘故障对数据中心环境下应用和服务的影响,为减少数据中心的运营成本提供了切实可行的方案。
在故障分析方面,分析了数据中心环境下磁盘负载对磁盘故障的影响。使用磁盘利用率和磁盘传输速度构建了磁盘负载的时间特征和空间特征,量化了它们对磁盘故障的影响。基于时空特征的分析结果,构造了引发磁盘故障的关键负载特征。除此之外,结合数据中心的实际情况,提供了若干条减少磁盘故障的磁盘负载调度建议。
在故障预测方面,使用检测与修正方法解决了数据中心环境下磁盘故障预测数据的不准确问题。通过分析数据中心的磁盘故障检测方式,揭示了磁盘故障预测数据中的标注不准确问题。根据相关邻域图中的切边加权统计方法与基于磁盘数据中不准确标注的特征修正策略,提供了一种磁盘故障数据中不准确标注的检测与修正方法。
在故障恢复方面,为数据中心解决了有限的故障恢复资源与不断增加的磁盘预警频率之间的矛盾所引发的数据安全问题。通过分析在面对多个磁盘预警时故障恢复资源与预警频率间的矛盾,揭示了数据中心构建实时磁盘故障恢复处理调度策略的迫切需求,并通过预测磁盘故障发生顺序构建了一种高效的磁盘故障恢复处理调度策略。
综上所述,围绕数据中心的磁盘使用特征和磁盘故障特征,从磁盘故障的原因,磁盘故障的预测和磁盘故障的恢复三个方面全面深入地研究了数据中心环境下的磁盘故障问题,增强了对数据中心磁盘故障的规律理解,降低了磁盘故障对数据中心环境下应用和服务的影响,为减少数据中心的运营成本提供了切实可行的方案。