CSPS模型基于学习的Look-ahead控制研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zzc2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际生产中,存在着这样一类重要的生产控制模型,即基于传送带服务的生产加工站(Conveyor-Serviced Production Station,简称CSPS)问题,其也是正(Industrial Engineering)/OR(Operations Research)领域的经典问题。随着流水线生产模式的普及,研究CSPS问题则具有比较重要的现实意义。根据CSPS问题的特点,其可以利用DEDS领域中的Markov决策过程(MDP)或半Markov决策过程(SMDP)建模,运用动态规划、强化学习等方法解决其优化控制问题。Markov性能势理论的提出,为MDP/SMDP优化提供了一种新的理论框架和途径。特别是性能势的样本轨道定义,使其可以自然地与强化学习、Rollout等方法相融合,丰富该类问题的优化求解算法。Look-ahead控制是研究CSPS问题的重要方法,即通过监控产品加工站以及传送带的相关信息,做出某些预先判断以便进行合理的行动选择。本文将以性能势理论为基础,研究CSPS基于学习的Look-ahead控制问题。首先,本文讨论的是考虑工件从传送带下载时间因素的CSPS问题,将其合理的建模为SMDP,建立了各种重要参数的推导公式。在SMDP模型参数已知情况下,讨论了基于性能势的策略迭代算法。其次,由性能势的样本轨道定义,建立了基于性能势的Q学习公式,给出了相关优化算法。同时,本文研究了CSPS基于平均准则和折扣准则统一的Rollout算法的优化问题,给出了相关学习公式以及优化算法。我们还采用了摄动分析的方法,结合系统运行的历史信息,给出了改进的Rollout算法。Q学习和Rollout算法不依赖模型参数的特点,使它们在解决这类实际生产问题具有潜在的优势。最后,本文考虑了一类实际生产例子,分别给出了三种算法的相关优化结果,分析了主要参数的变化对系统性能的影响。比较相关优化结果以及结合实际分析,说明三种优化算法是有效的。
其他文献
在以各厂商和开源社区为代表的业界努力推动下,随着J2EE技术的推广,越来越多的企业应用系统将J2EE技术作为分布式应用的解决方案首选。每个企业应用系统都需要某种形式的安全措
随着计算机网络技术的发展及其应用领域的不断扩大,家庭网络技术已经由最初的概念框架过渡到了部署与应用阶段。家庭网络具有分布地区广、设备类型复杂、标准不统一、占用大量
伴随着Internet技术获得的巨大成功,IP技术成为未来信息网络的支柱技术之一,以IP为核心的分组化和以移动通信为核心的无线化已成为电信网络演进的主流方向。而软交换技术的出
序列学习是机器学习中的一大类问题。其研究的对象是序列型的数据。传统的关于序列学习问题的研究主要集中在如声音信号、DNA序列等这种简单的序列,近年来又出现了针对序列元
从60年代爆发软件危机,诞生软件工程这一新兴学科以来,软件工程的研究不断前进。一方面积累了一大批的成果和技术,形成了较为成熟的传统软件工程;另一方面不断引入新的先进的工程
随着3G通信系统的快速发展,移动多媒体通信技术已成为时代焦点,各种多媒体应用已逐渐从有线领域向无线领域发展,全方位地满足人们对于多种媒体、多种感观的需求。作为移动多
嵌入式地理信息系统(Embedded GIS)是集成了GIS功能的嵌入式系统产品,是在系统设计与开发层次上的应用,是一个软硬件混合的系统,它为移动中的导航、定位、地图查询和空间数据管
本文首先介绍了课题实施的背景,提出了课题研究的技术路线并进行了论证,详细论述了系统总体设计框架,对系统涉及的关键技术难点进行了分析并提出了解决思路。 详细设计了基于
随着计算机软件技术的广泛应用,计算机软件的质量已成为一个非常重要的问题,软件测试是解决软件质量问题的有效手段。软件测试作为软件开发过程中的一个重要阶段,受到了软件开发
在软件系统的整个设计过程中,软件体系结构的选择不仅影响软件开发的各阶段,而且对软件系统的可维护性、可扩充性都是至关重要的。软件系统的结构设计是从计算机软件的角度对软