论文部分内容阅读
一些较复杂的物理系统或工业过程中总存在着一些小的惯量、电导或电容,或者含有多个不同量级的时间常数,这使得作为数学模型的微分方程有相当高的阶数,以及病态的数值特性。这种含有小参数的系统称为奇异摄动系统。本文基于自适应动态规划算法对奇异摄动系统的最优控制问题进行了深入的研究。其主要工作如下:(1).针对一般形式的非线性仿射系统,研究了自适应动态规划(ADP)算法来解决最优控制问题。该算法从初始性能指标函数开始迭代,经过控制律和性能指标的逐步更新,最终收敛到系统的最优性能指标,有效地避免了直接求解复杂的HJB方程。并且给出了严格的收敛性证明和具体的实现方法。引入神经网络来近似系统的性能指标,提高了逼近精度,并给出了基于神经网络的自适应动态规划算法。(2).深入研究了奇异摄动系统的一些性质。首先给出了边界层校正法,来分析奇异摄动系统解的性质。然后从多重时间尺度的角度认识到,对于含有小参数ε的奇异摄动系统,它存在着相差ε倍的两类特征值。因此,通过变量转换可以将奇异摄动系统最优控制问题分解为两个相对独立的快、慢问题,分别对其设计最优控制器,并根据组合控制原理,就能得到原奇异摄动系统的一个次优控制。(3).针对一类非线性奇异摄动系统,基于自适应动态规划算法设计次优控制器。首先对非线性奇异摄动系统进行分解得到快、慢两个子系统,然后通过引入神经网络来近似快、慢系统的性能指标,给出了基于神经网络的自适应动态规划算法,分别获得子系统的最优控制,最后得到组合控制,并证明了该控制是原奇异摄动系统的一个次优控制。(4).针对一类非线性奇异摄动系统,基于广义HJB (GHJB)方法研究了其两个子系统的最优控制问题,进而获得组合控制。该方法从初始稳定控制开始迭代,根据Galerkin方法求解GHJB方程得到相应的性能指标函数,并由此进一步更新控制律,如此迭代下去直到收敛到系统的最优控制律。