论文部分内容阅读
伴随我国经济进入常态化增长轨道,工业体系改革不断深入,对能源的需求也正在稳步增长。近年来,以石油天然气为代表的化石能源在开采、净化、运输等生产过程中,安全问题日益凸显,采用数据驱动的方法进行异常检测及预警成为当前研究的前沿和热点。针对过程工业监控数据所具有的孤立性、非线性、非完备性等特点,文章引入统计过程监控理论(statistical process control,SPC)及核(Kernel)方法,建立油气井安全生产状态整体评估模型和异常诊断算法,以提升算法的准确性。论文主要工作包括以下方面:1、采用基于聚类的核主元分析算法,用以解决油气井安全生产状态的整体表征问题。通过核映射方法解决简单状态表征在数据降维过程中丢失非线性信息的问题,在内积转换得到的高维线性空间中,采用样本核映射聚类中心进行特征分解,推导出平方预测误差等统计量分布作为系统状态整体表征依据。算例验证了该算法可有效降低误报率。2、提出了基于独立成分分析的核解耦Fisher判别算法,解决完备样本下油气井安全生产异常诊断分类问题。通过独立成分分析实现了参量独立性解耦,在高维线性空间中,给出了基于余弦夹角的类别判别方法,给出了完备历史数据样本得到异常最优判别向量库的方法,实现了油气井安全生产中实时异常的诊断分类。通过算例证明其提升了油气井异常诊断精度。3、提出了基于聚类支撑向量描述的集成学习算法,解决油气井安全生产监控样本数据在不完备情况下的异常分类问题,针对传统支撑向量描述算法局限于单类样本域的不足,将支撑向量描述推广至多类异常样本域:将多类异常样本聚类中心向量替换不完备样本作为分类输入,计算新算法中超球体半径等分类描述阈值,完成多类不完备样本条件下支撑向量域分类。集成学习方法的引入,通过调整训练样本和弱分类器的权重,解决了传统聚类支撑向量描述分类精度不足问题。算例表明该算法能有效地分类新的孤立故障类型。4、实现了整体状态表征与异常分析的算法集成,并提出了基于OSA-CBM标准体系的油气井安全生产监测的系统框架。离线空间中异常最优判别向量库的建立在帮助在线空间实时数据整体表征和异常诊断的同时,通过反馈完成最优判别向量或异常样本的更新,形成了数据监控算法的闭环,实现了算法集成。在此基础上,进行了监测预警系统的数据存储、分析计算、交互展示分离设计,实现模型的动态管理和弹性扩展,可快速表征系统整体状态,动态更新异常样本库,对故障进行在线诊断和预警。论文对我国西南油气田某天然气净化厂脱硫、脱水过程监测参量数据进行了实证:在对过程整体表征中,正常工况下的误报点数从传统算法的27个降至新算法的6个;在对完备样本的解耦判别分析中,样本维数从1050维降至149维,Fisher判别值从3.45×108降至5.87×104;在对不完备样本多类别异常分析中,文章提出的算法识别出传统SVDD算法无法识别的异常样本,50个引入的测试异常样本中仅5个点位未能识别,集成学习改进算法将误报样本聚类的分类精度提升至100%。实证结果表明了文章所提出算法的有效性。