论文部分内容阅读
生产过程数据通常隐含了工艺参数、设备状态和调控策略等信息。随着大数据技术的飞速发展,这些数据的价值被逐渐发掘并受到重视。通过对生产数据的分析、建模与应用可实现工业生产的智能化管控。为提高数据分析、建模的效率和准确性,对生产数据进行预处理是必不可少的环节。目前,数据预处理主要依靠分析师的个人经验,尚未形成完整成熟的数据预处理体系,从而造成数据预处理的效率和处理后的数据质量参差不齐。本文以流程工业生产数据为研究对象,针对流程工业生产数据的特点,对数据预处理的方法体系进行了完善,可有效提高流程工业生产数据预处理的效率和数据质量。论文首先对国内外工业数据预处理的理论知识进行调研,总结了不同预处理方法的适用情况和优缺点,在此基础上提出了针对流程工业生产数据预处理的一般性框架。该框架主要分为三部分:(1)多维时序数据中缺失值的分类处理;(2)基于自相似特征的数据噪声处理;(3)基于先验知识的维度选择。在此基础上,设计并完成了流程工业生产数据预处理系统原型。最后,对Y企业水泥烧成系统数据进行了预处理实验,结果表明该数据预处理框架不仅可以完成数据预处理工作,还可以有效地提高数据质量。