论文部分内容阅读
污水处理已成为大中型城市水资源充分利用和实现可持续发展的重要基础
设施之一,日益受到重视。就目前而言,活性污泥法是城市污水处理最主要的
工艺技术之一,IAWQ提出的ASM模型和人工神经网络方法(ANN)是研究活性
污泥法反应规律的两种最主要方法。由IAWQ专家提出的基于工作机理和参数
标定的ASM序列模型,在国内外得到了广泛的应用,是污水处理学界的研究热
点之一,但仍在不断的发展和完善中。ANN技术近20年来得到了极大的发展,
在活性污泥法的建模研究中正日益受到重视,但也仍在不断的完善和发展中。
作者针对污水处理活性污泥法具有高度非线性、复杂和工作机理尚不十分清楚
的特点,采用特别适用于动态非线性和“黑箱”系统建模的ANN技术,建立了
松江污水处理厂活性污泥系统的ANN模型。
作者详细阐述了应用ANN技术建模的训练方法、过程及其训练ANN模型
的实质,讨论了ANN模型的计算(拟合)能力(针对训练样本而言)与逼近能
力(泛化能力或性能)(针对非训练样本而言)之间的联系与区别,并强调:对
于输出变量是连续函数变量的情况,无论采用何种结构的网络,训练样本数均
必须多于隐层节点数;隐层节点太多和训练过度是导致训练时出现“过训练”
现象的内因和外因;针对一定数量的训练样本,必定存在一个合理的隐层节点
数,用试凑法确定合理的隐层节点数仍然是目前最有效的方法;训练模型的目
的是为了揭示出(抽象出)训练样本数据所蕴含的规律,即建立的模型对非训
练样本数据同样也应该有好的表征能力(即泛化能力);必须用非训练样本误差
表示模型的泛化能力或性能等等。
采用BP网络建模,一般要求训练样本数要多于网络连接权值数,通常2倍
以上,最好5~10倍以上。作者总结并提出了完整的应用ANN建模的基本原则
和步骤:首先将样本随机分成训练样本、检验样本和测试样本 3 部分(训练样
本用来在训练过程中调整网络连接权值,检验样本用来在训练过程中实时监控
训练过程,测试样本用来评价建立的 BP 模型的泛化能力);通过很多次随机改
变网络初始连接权值以求得全局极小点邻域内的可行解;训练过程很容易进入
局部极小点而出现“过训练”现象,必须用检验样本实时监控训练过程并采取
早期停止法以避免出现“过训练”现象。
采用RBFNN建模,尽管训练时不存在“过训练”现象,但隐层节点过多也
会出现“过拟合”现象,从而降低模型的泛化能力。
作者剖析了现有的活性污泥系统ANN模型普遍存在的不足:取太大的网络
结构 (隐层及其节点数太多,以致出现网络连接权值数多于训练样本数的情况,
甚至出现隐层节点数多于训练样本数的情况);采用BP网络建模时,没有采用
检验样本实时监控训练过程而无法判定训练过程是否进入局部极小点和发生
“过训练”现象;用训练样本误差或少数几个测试样本误差来评价模型的泛化
能力;只取一组或很少几组网络初始连接权值训练模型,很难搜索到全局极小
点的邻域,如果训练样本误差太大,一味通过增大网络结构使误差减小,这样
建立的模型的有效性、可靠性很难分析判定,是否具有实用价值还有待进一步
验证。采用BP算法,收敛速度很慢,并且极易进入局部极小点,较难求得全局
极小点。采用RBFNN网络建模时,在用试凑法确定合理的隐层节点数时部分论
文选取的隐层节点数大于训练样本数。这些论文建立的模型多数是关于某一时
刻出水水质与同一时刻进水水质和运行控制参数之间的关系,事实上,这些参
数之间不存在实际的因果关系。因此,这样建立的模型没有多少实际运行意义。
本文还较详细地分析了三篇博 (硕) 士学位论文建模的基本情况。
在分析比较的基础上,作者选择松江污水厂2003年1月1日~2004年10
月31日(670天)的实际运行历史数据作为建立污水厂活性污泥系统ANN模型
的基础数据(测定出水水质数据的时间比测定进水水质数据的时间滞后一个水
力平均停留时间)。提出了对原始数据进行整理、预处理的数据有效范围准则和
活性污泥系统工作机理准则,并采用可视化、动态数据处理方法对基础数据进
行了校核与修正,经剔除异常数据和修正错误数据等处理后,得到了656组有
意义的数据。为提高模型的有效性和可靠性,再应用正态分布规律方法剔除过
于分散的离群数据,最后得到了可用于建模研究的 630 组有效数据,并建立了
可供调用的数据文件。设定2004年10月的29组数据为预测样本(数据),随
机抽取60组(10%)数据为测试样本。
作者采用 STATSOFT 公司出品的商品化神经网络通用软件 STATISTICA
Neural Networks 进行建模研究。
针对上述整理得到的活性污泥系统运行的 630 组有效数据,分别采用 BP 网
络和RBFNN网络进行建模研究。用试凑法确定合理的隐层节点数;验证隐层节
点多少对模型计算能力和泛化能力的影响;分析训练过程是否容易进入局部极
小点从而出现“过训练”现象。对于BP网络,用拟牛顿法训练模型,大大提高
了收敛速度,单次训练的时间从10多个小时减少到20分钟左右。采用模型的
多个性能指标(如RMSE、AAE、MAPE和R等)和数据特征值指标(如均值、
最大值、最小值和标准剩余离差等)综合评价模型的泛化能力和性能,以避免
因采用单个或少数几个指标而引起的片面性。
设计 BP 网络时,首先随机抽取 60 组(10%)数据为检验样本,主要研究
隐层及其节点数多少对模型计算能力、泛化能力、是否出现“过训练”或“过
拟合”现象及其如何避免出现“过训练”现象等问题,以提高模型的泛化能力;
通过很多次随机改变网络初始连接权值,以求得全局极小点邻域内的可行解。
设计RBFNN网络时,主要研究隐层节点数、径向基函数宽度与中心值、邻
居数多少及其偏差值求解方法等对模型计算能力和泛化能力的影响。
大量试验研究表明:①采用BP网络建模,当网络连接权值数少于训练样本
数时,采用检验样本实时监控训练过程以避免出现“过训练”现象、用拟牛顿
法训练模型、很多次随机改变网络初始连接权值以求得全局极小点邻域内的可
行解、用试凑法确定合理的隐层及其节点数以避免出现“过拟合”现象,可以
建立泛化能力较好和合理、可靠、有效的活性污泥系统 BP 模型,测试样本的平
均相对误差小于8%。②采用RBFNN网络建模,用试凑法确定合理的隐层及其
节点数以避免出现“过拟合”现象,取合理的基函数宽度与中心值和邻居数,
可以建立泛化能力很好的活性污泥系统RBFNN模型,测试样本的平均相对误差
小于8%。研究表明,对于本例数据,BP网络与RBFNN网络具有基本相同的计
算和泛化0能力。
利用29组预测样本数据对建立的ANN模型的泛化能力进行了校验分析,
BP模型的相平均对误差小于5%,RBFNN模型的平均相对误差小于8%,说明
建立的ANN模型具有较高的预测精度,具有较好的工程实际应用价值。
根据数据分布的稀疏性和有效性以及ANN模型变量内插值有效性的特点,
确定ANN模型单变量和有相互依存与约束关系的变量的有效取值范围。因此,
建立的ANN模型对每个变量仅在一定的数据范围内有效,超出上述变量的有效
数据范围,ANN模型的精度和可靠性就难以得到保证。为此,针对全国各地不
同的环境条件、不同的污水水质、不同的活性污泥法工艺参数(如曝气池平均
水力停留时间、回流污泥浓度等),应分别建立ANN模型。所以,通过首先选
定活性污泥工艺的主要水质参数、运行控制参数(统称为变量)等,其次是确
定每个变量的可能取值范围,并根据实际情况,把每个变量分成几个小的有效
取值范围区间,从而建立多个适用于变量不同有效取值范围的模型,对ANN模
型进行标准化处理,从而形成模型库。提出了活性污泥系统ANN模型标准化的
概念,阐述了建立标准化ANN模型 (即模型库) 的内容、基本步骤和要求等。
利用建立的ANN模型进行了活性污泥系统的仿真模拟研究,定量验证了活
性污泥系统的有关工作机理,分析了进水水质、运行控制参数等对污水处理效
果(出水水质)的影响;对控制参数进行灵敏度分析以进行活性污泥系统的辅
助运行、管理与决策等研究;简要说明了利用建立的ANN模型进行活性污泥系
统辅助设计的一般方法和步骤。
本文提出的建立ANN模型的基本原则和步骤,对建立活性污泥系统 ANN
标准化模型具有很强的指导意义,对确保建立的标准化模型的有效性、合理性
和可靠性具有理论和现实意义。提出的测定出水水质的时间应比测定进水水质
的时间滞后一个水力停留时间的原则,以确保建立的ANN模型更符合活性污泥
系统的工作特性,防止建立不符合活性污泥系统工作特性的“伪模型”——同
一时刻出水水质与进水水质之间的数学模型。
应用ANN模型进行活性污泥系统仿真研究,对进一步研究活性污泥系统工
作机理具有便捷、快速和经济的特点。利用ANN模型进行活性污泥系统辅助设
计,可大大提高设计的有效性、预见性和缩短设计周期。利用ANN模型和变量
灵敏度分析的结果,为实现活性污泥系统的自动控制和优化控制提供了可靠的
数学模型(技术保障)和现实可能性。
指出了利用ANN技术建模目前还缺乏完整的理论公式指导、ANN模型具
有非唯一性和模型的可靠性、有效性较大程度上还取决于原始建模数据的可靠
性、本文研究的数据还不够十分充足以及得到的ANN模型中没有包括DO、温
度(由于工厂原始记录中缺少这些参数的数据)等方面的不足。
同时提出,目前应集中全国研究力量,加强政府的宏观调控和高校、研究
所和污水处理厂的合作,进一步加强ANN建模技术的研究,收集更多、代表性
更好的污水处理厂的实际运行数据,建立适用于变量不同有效取值范围的ANN
模型库,使活性污泥系统ANN模型的研究从单纯理论研究走向生产实践,实现
活性污泥系统的自动、优化控制,以确保出水水质和提高经济性。
关键词:活性污泥系统,神经网络,建模,过训练,实时监控,泛化能力,仿
真,控制,标准化