论文部分内容阅读
随着社会经济的发展和科技的进步,无线网络为人们提供了越来越迅速且高质量的服务,无线网络在生产生活中扮演了越来越重要的角色,人们对电子产品的依赖进而促进了对无线网络的依赖。随之而来的是无线网络规模的快速增长,维护难度的增大。如何高效利用现有资源对未来可能发生的故障进行预测,从而提前做出反应,早已成为无线网络管理中的一个重要研究领域。然而当前无线网络故障预测研究中依然存在着不足,当前工作大多使用传统的数据挖掘方法,很大程度上依赖于研究人员对整个无线网络系统的理解,这在大规模部署的无线网络中难度越来越大。同时,在当前的无线网络故障预测中,研究人员多使用告警数据、关键性能指标等结构化的数据,对于日志这样半结构化的数据则利用较少。文本针对这两个问题,设计了一种日志的数值转化方法及两种无线网络故障预测算法,并在实验中验证了算法的可行性及有效性。具体而言,主要的研究内容及成果归纳如下:第一,应用自然语言处理的方法,将日志数据转换为数值信息。将无线网络日志数据直接视作一个单纯的文本,通过数据清洗,日志数据转变为一个由单词组成的“文章”,使用滑动窗口就能够从日志中提取出日志样本,每个日志样本中的日志序列都是一个单词序列。同时使用词嵌入的方法,就能够将每一个单词序列换为矩阵,从而将整个日志文本转换为可以计算的数值信息。本文针对两种故障预测模型分别设计了两种日志数据的提取方法。第二,使用两个滑动窗口获取日志样本中的输入序列以及对应的故障标签,在经过词嵌入转换为矩阵之后,利用卷积神经网络检测特征的优势,通过多个卷积层与池化层对日志信息进行特征的自动提取,以分析当前日志输入序列与未来系统状态之间的关系,从而能够预测无线网络在未来可能存在的故障。在此过程中研究人员只需要很少的领域知识。第三,在前述基于卷积神经网络的预测模型基础上,从第二个滑动窗口中提取故障标签的同时提取输出未来日志序列,利用序列到序列模型对当前日志及未来日志之间的关系进行建模得到日志预测模型,从而能根据当前日志对未来的日志进行预测。此后利用未来日志与对应故障标签,基于卷积神经网络对未来日志与未来系统状态建模得到故障判断模型,从而达到预测未来故障的目的。