基于性能势的随机系统最优控制

来源 :东南大学 | 被引量 : 0次 | 上传用户:zhanggl981025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究随机系统的最优控制问题,寻找适用于非线性系统的在线优化算法。论文将随机控制系统看作连续状态的马尔可夫决策过程,通过系统的性能势建立优化方程,进一步利用优化方程得到策略迭代算法。性能势可以由系统的样本路径估算得到,该算法既适用于线性系统又适用于非线性系统,并且便于在线计算。 全文由以下五部分组成: 第一部分:介绍随机系统最优控制的研究背景和意义,概述随机系统最优控制的研究历史和现状、研究内容和研究方法。 第二部分:介绍本文所需的预备知识,包括常用的随机过程,特别介绍了马尔可夫过程和随机系统最优控制的一般理论。 第三部分:将随机控制系统看作马尔可夫决策过程,根据系统的性能势建立优化方程和策略迭代算法。进一步给出在线算法的方法和步骤,并尝试利用神经网络来加快在线算法的计算速度。 第四部分:将基于性能势的策略迭代算法应用到随机线性系统最优控制问题上,得到了求解最优控制律的黎卡提方程,其导出过程有别于传统方法。并将该算法与贝尔曼动态规划法相比较,分析各自的特点。 第五部分:对全文进行总结,对今后的研究趋势进行展望,并指出有待进一步研究的问题。
其他文献
锌是农作物生长发育所必需的一种微量元素,缺少了它,作物就不能正常生长发育。玉米在缺锌时会出现“失绿花白叶病”,其主要特征是:刚出土的幼苗往往全株由淡绿色逐渐变白失
现代流程工业具有规模大、复杂性高、变量多且耦合性强等特点,使得生产过程发生事故的可能性增大。为了获得稳定、持续的高质量产品,对这些设备进行早期、准确的故障检测与诊
目标导学是一种教学方法,具体到课堂,具体到课型,才有教学模式的构建。目标导学教学是改善教学过程的一种模式,是把教学目标融入到教与学的每一个细节,最终达到理想的教学效
随着高速公路建设的发展,路面病害检测技术的提高也迫在眉睫。本文的项目背景是南京理工大学“N—1型道路状况智能检测车”项目,目的在于对其中的智能病害识别系统进行改进,增强
【摘要】地理教学和学习的案例资料来源很广,就看是否有发现的眼睛,只要有心,处处都有。我深信案例教学的运用必将使地理课堂教学更具活力,更有魅力,教学效果更好。  【关键词】开发利用 案例资源 构建 高效课堂  【中图分类号】G633.56 【文献标识码】A 【文章编号】2095-3089(2015)02-0190-02  随着新课改的不断深入实施,广大教师纷纷投入到新课改中,践行课改的新标准、新理念
【摘要】当前教育形势一片大好,但也有些美中不足,如学校以应试教育为主,家庭教育与社会教育、学校教育各自为战,无法发挥应有的作用,本文观点认为应该解决这些问题,把三者有机结合,取长补短,从而取得最佳的整体教育效果。  【关键词】学校教育 家庭教育 社会教育  【中图分类号】G40 【文献标识码】A 【文章编号】2095-3089(2015)02-0192-02  在很多人眼中,好像教育只是学校的事,
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
总 类 期(页)山东花生生产优势及向商品优势转化的途径………………………………………2(35)除草剂在花生生产上的应用…………·,………………………………………,……3(33)
现场总线技术成为了自动化技术发展的热点,并已经导致自动化系统结构与设备的深刻变革。以太网技术的飞速发展,使基于以太网的工业应用越来越广泛。将现场总线与以太网技术相
【摘要】幼儿数学学习,属于科学学习的范畴,是幼儿在解决实际问题的过程中发现和理解事物本质和事物间关系的过程,幼儿在运用数学解决实际生活问题过程中,不仅获得丰富的感性经验,充分发展形象思维,而且在感知具体事物基础上初步尝试归类、排序、概括、抽象,逐步发展逻辑思维能力,为其它领域的深入学习奠定基础。在幼儿数学学习中,要重视培养幼儿的学习兴趣,培养探究的能力,适合幼儿特点的教学方法显得至关重要。  【关