论文部分内容阅读
随着现代化工过程日趋复杂化与综合化,运行工况和操作环境也愈加多变,带来企业生产效率提升的同时,也使得过程故障发生的几率逐渐增大。与其他工业部门相比,化工故障具有更大的危险性,因此准确及时的诊断故障成为化工领域的研究热点之一。随着传感器和计算机技术的发展,大量历史数据被采集与存储,使得基于数据驱动的智能故障诊断方法逐渐成为近年来故障技术研究领域的研究热点,并具有重要的现实意义。而深度学习作为基于数据驱动方式的新兴分支,以其强大的特征提取能力以及处理复杂,高维,非线性等数据的独特优势也已经在模式识别领域取得众多成果,并为化工故障诊断方法提供了新的范式。本文从面向数据驱动的化工故障诊断这一背景出发,以深度神经网络(Deep Neural Network,DNN)模型为基础,针对化工过程数据的无标记、不平衡、数据流式特性,对基于深度学习的化工故障诊断方法展开研究。(1)针对化工场景下有标记故障数据缺失这一现实特性,提出一种结合主动学习的深层故障诊断方法。首先利用典型的深度学习构架—堆栈降噪自编码器SDAE(Stacked Denoising Auto-Encoder,SDAE),以无监督的方式实现化工过程数据的抽象特征表达。在模型微调阶段,提出一种针对化工过程的主动学习标准,根据模型需求选择标定样本,最大化实现有标记数据对DNN诊断模型的性能改善。深度学习在复杂非线性化工过程数据的应用,解决了传统浅层模型表达能力不足的缺陷,完成手动特征提取到自动特征提取的转变;同时结合提出的主动学习策略,进一步提升了有标记样本的有效性。(2)针对化工过程数据存在故障类别不平衡这一现实特性,研究了一种自适应不平衡修正的深层故障诊断方法。首先针对原始故障数据的不平衡性问题,提出一种改进的不平衡数据处理算法,从数据层面上改善DNN模型的故障诊断性能。然后在模型层面上,研究了一种结合主动学习的不平衡修正方法,以模型自身需求为反馈,实现对不平衡参数的自适应修正。实验结果表明,该模型在g-mean和敏感度指标下具备更优的效果,适用于数据不平衡场景下的化工过程故障诊断。(3)针对现实化工故障数据的流式特性,研究了一种分层增量的深层故障诊断方法,实现了对DNN诊断模型的增量更新。首先采用模糊均值方法将数据流下的多个故障模式根据相似度分成多个“超类”,每个“超类”对应一个扩展子模型进行单独训练。子模型以“克隆”的形式继承原始模型的学习参数,实现旧知识的动态迁移。实验结果表明提出方法具备较高的诊断精度,并针对化工流式数据具有较强的适应性。