一种基于强化学习的控制算法研究

来源 :计算机仿真 | 被引量 : 7次 | 上传用户:jukai9751
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在阐述了强化学习的基本机制的基础上 ,根据复杂工业过程的非线性、多变量、大时延、强耦合的特点 ,提出了一种将基于案例的学习和强化学习相结合的控制算法 ,并对重油分馏塔进行了控制效果的仿真实验 ,控制结果显示了算法能够很好地满足控制任务。
其他文献
随着仿真培训系统得到广泛应用 ,早期采用指针式仿真仪表的仿真仪表盘已经不能适应新的需要。该文提出了一种基于采用液晶显示单元、通过RS -4 85接口传输数据的新型仿真仪表盘的构造方法 ,介绍了系统的设计目标和总体结构。仿真仪表采用了单片机系统 ,给出了原理图 ,讨论了相关软件。教师指令台工作在Windows 2 0 0 0系统下 ,讨论了软件编制的关键技术。在本系统中通讯软件是系统的关键 ,给出了
经济全球化,人类知识产权强化保护及出版的国际化,已成为21世纪不争的事实。固步自封的出版机制和经营模式已经成为历史。出版社要想不被淘汰,就必须学习和掌握国内国外两种资源
直、摆组合凸轮机构是一种新型的机构类型 ,它所能实现的凸轮曲线非常丰富多彩 ,对其进行运动仿真 ,对于验证设计的正确性以及指导实际生产都有重要的现实意义。该文首先简介了直、摆组合凸轮机构的设计方法 ,进而介绍了该机构的动态仿真软件和动态仿真技术 ,并对动态仿真中的几点关键技术作了进一步的阐述。
承包商的现金流动态均衡对不确定条件下项目的顺利实施有重要影响。作者研究基于随机活动工期的现金流动态均衡前摄性及反应性项目调度问题,目标是在随机活动工期条件下,为承