论文部分内容阅读
多模型可以显著改善模型估计精度,提高模型泛化性能。本文结合实际工程应用背景,对双酚A生产过程中的结晶塔单元进行多模型软测量建模,以实现各种过程变量的在线监测。
在众多的多模型建模方法中,基于聚类的多模型建模方法受到了广泛的青睐。但是,聚类算法中关于如何初始化聚类个数、聚类中心等问题长期以来一直都没有得到很好的解决,它间接制约了多模型的发展。同时,大多数聚类算法不具有鲁棒性,当样本数据集中存在异常样本点时,聚类效果大打折扣。此外,聚类算法自身也存在着一定的缺陷:在对样本数据集进行聚类的过程中,它仅利用了样本数据的输入集,而忽略了输出集对最终聚类结果的巨大影响,这在一定程度上影响了聚类结果的有效性。最后,作为多模型最重要的部分,子模型的好坏直接关系到最终的多模型精度。
针对以上问题,本文从以下方面着手对聚类算法和子模型建模方法进行改进,建立有效的多模型软测量系统:
1、鉴于传统聚类方法严重依赖于样本数据先验知识和初始参数的固有缺点,提出一种适用于任意形状样本分布的单参数调节扩张搜索聚类算法。该方法以近邻算法为基础,定义各样本的ε-邻域,通过扩张搜索的方法将所有相关联的ε-邻域样本归为一类,从而聚类样本数据。将其用于聚类样本数据,得到基于扩张搜索聚类的多模型建模方法。
2、为抑制异常样本点对聚类结果的影响,提出一种基于局部重构融合流形聚类的多模型软测量建模方法。该方法将样本集拆分为多个互不相交的样本子簇,克服异常样本点对聚类结果的影响;以各样本子簇重构线性流形面,融合属于同一流形面且相距较近的样本子簇,得到多个子类;采用支持向量机为各个子类样本建立回归子模型,得到软测量多模型。
3、针对传统聚类算法在处理不完备信息时存在的不足,提出一种基于二次数据划分的多模型建模方法。该方法对聚类得到的样本子簇利用改进的粗糙集分类器进行二次数据划分,在一定程度上消除矛盾样本点可能对模型精度造成的影响。对得到的各个子类利用支持向量机建立回归子模型,得到多模型软测量系统。同时,鉴于分类过程中可能由于样本分布不均而出现不平衡分类问题,采用改进的加权粗糙集分类器对上述算法作进一步的改进,提高分类器的精度,确保了多模型的有效性。
4、子模型的效果直接影响着最终的多模型精度,提出一种局部惩罚加权核偏最小二乘算法。该方法通过核映射将原始输入映射到高维特征空间实现非线性问题的线性化处理,通过偏最小二乘算法进行主成分提取,降低数据维数;对由主成分构成的新数据集,依据局部学习思想构建局部惩罚加权最小二乘回归模型,有区别的对待各样本的贡献值,在一定程度上抑制异常样本点的影响,优化模型参数。鉴于多模型可以改善模型估计精度,提高泛化性,采用扩张搜索聚类算法聚类样本集,对得到的聚类子簇依据上述算法建立回归子模型,得到多模型软测量系统。
在双酚A生产过程质量指标的软测量建模仿真中验证了上述各方法的有效性。