论文部分内容阅读
近年来,随着我国通信技术发展迅速、通信网络规模及复杂度不断扩大,通信网络每天产生大量的告警。由于通信网络告警数据量很大,告警信息十分零散,一旦网络发生故障,网管人员要在数量庞大的告警数据中找到有价值的信息十分困难,从而无法迅速定位引发故障的根本原因、无法快速恢复、消除和预测故障;在清除故障后,不能得到对未来的网络管理有价值的信息。为了能够智能的获取告警信息,告警相关性分析的研究是非常有必要的。本文基于数据挖掘对通信网络告警进行相关性研究,采用关联规则分析方法和序列规则分析方法,对原始告警数据进行预处理,设计并实现挖掘模型对中国移动通信集团公司提供的告警数据进行挖掘。论文的主要工作包括以下几点:对告警数据进行预处理。告警数据预处理分为两部分:一是通过分析和总结告警数据特征,设计合理的告警过滤机制和实现方案,减少待分析的告警数量,从而提高挖掘效率。二是设计、实现滑动窗口机制,将过滤后的告警数据转化为数据挖掘模型必需的事务集。对告警相关性和告警数据挖掘进行分析,阐述几种经典的关联规则和序列规则算法,分析和比较不同关联规则和序列规则算法。分别设计关联规则和序列规则模型,并用数据挖掘工具SPSS Clementine建立模型来对告警数据进行挖掘,并以图形和表格的形式呈现规则信息。分析得到的关联规则和序列规则,并验证规则的正确性和在告警故障分析中的价值。本论文的研究意义在于从庞大复杂的原始告警数据中获得网络告警的关联规则和序列规则,为通信网络告警信息的分析提供一个有效的解决方法。挖掘的结果可以帮助网络维护人员更好的分析和定位网络故障,实现对未来网络设备故障的预测,具有较强的应用价值。将数据挖掘思想很好的融合在建模过程中,提供了理论实践相结合的一个典型范例。