论文部分内容阅读
北美电力可靠性委员会(NERC)于1997年正式推出了联络线功率与系统频率偏差(TBC)模式下自动发电控制(AGC)的最新控制性能标准(CPS)。CPS标准更注重AGC系统的中长期收益,从根本上改变了传统AGC的控制思想,如何设计适应CPS标准下AGC系统的快速动态优化控制策略成为一个全新的理论研究课题。
首先,本文概述了频率及联络线功率控制原理,介绍了国内外AGC控制策略研究现状和AGC控制性能考核标准的发展过程,接着对当前国内各省网电力调度中心所用南瑞集团(NARI)提出的CPS控制规律进行数学分析。在深入研究CPS考核指标的数据统计特性及优化控制目标基础上,指出CPS标准下的互联电网AGC系统应被看作“不确定的随机系统”,数学模型以高斯一马尔可夫随机过程建模,从而将强化学习理论中基于随机最优控制技术的Q-学习方法引入CPS控制领域。
其次,以标准两区域互联系统和广东电网的负荷频率控制(LFC)模型为研究对象,系统地应用单步Q-学习和多步回溯Q(λ)学习方法对区域电网调度端的CPS自校正附加控制和动态优化控制等三种控制结构进行详细仿真比较分析,并解决了控制器在预学习阶段的系统镇定和收敛问题。统计性仿真比较试验显示引入Q-学习方法能有效实现控制策略的在线自学习和动态优化决策,增强了AGC系统的鲁棒性和适应性且提高了CPS考核合格率。据国内外查新显示,迄今尚未有任何基于马尔可夫决策理论的优化和控制方法在CPS控制领域出现。
最后,本文结合马尔可夫决策过程(MDP)理论对如何实现CPS松弛控制目标进行细致研究与仿真校核,即在保证电网复杂运行方式下CPS考核合格率的前提下尽量地减轻AGC机组的调节压力及成本。针对AGC松弛控制过程中呈现的离散控制特征,探讨了CPS相空间如何合理量化为有限子状态空间与输出功率动作集以实现对机组控制的松弛性,然后讨论了MDP奖励函数的恰当选取和各控制参数的意义及变化规律。仿真验证该策略具备在线调整AGC系统的松弛程度从而达到节能调度的目的。
本论文的研究得到国家自然科学基金面上项目“CPS标准下AGC最优松弛控制及其马尔可夫决策过程(50807016)”的资助。