基于多层强化学习的多机器人团队协作

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:allans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出的多层强化学习思路,应用在仿真平台实验及真实机器人实验中,较好的实现了多机器人的团队协作,表明了该算法的有较强的适用性和通用性,为以后将该方法应用到实际机器人奠定了一定基础。 首先对多移动机器人智能学习的研究现状进行简单的论述,并对多移动机器人团队协作系统的特点、体系结构进行简要的概述。接下来,在简介强化学习现状和背景之后,介绍了强化学习方法基本概念、算法原理及其基本结构,详细论述了多种强化学习算法以及多机器人团队协作的几种常见任务。然后,对基于多层RL的强化学习进行了仿真实现。在简介仿真软件之后,阐述了采用单层RL所面临的问题从而提出了采用多层的原因和思路。随之进行了详细的多层RL仿真实验设计和仿真结果分析。最后,在介绍真实RL实验平台之后,设计了真实机器人的强化学习实验任务。对任务进行了具体的实验设计,并针对真实实验结果进行了处理和分析。
其他文献
读报刊、听广播,经常可以看到.听到这样的话:对某人、某事“要依法严肃处理.”仔细推敲,“严肃”二字实属多余. 我们的每一部法律都是严肃的,依法处理任何一件事、一个人也
美国棉花科学家经过多次试验后得出结论,将棉花行距由101.6厘米改为35.6厘米后,单产显著提高。据科研人员在加利福尼亚州英佩里尔盆地试验,行距为101.6厘米的棉田,籽棉平均
【基金项目】本文是中国教育学会“十二五”科研规划项目“区域教育现代化建设背景下教师专业发展研究”(编号:19070251)、广州市花都区“教师专业发展研究”专项课题“初中教师心理素养的现状研究”(编号:HDJS201204)成果之一。  【中图分类号】G635.1 【文献标识码】A 【文章编号】2095-3089(2015)05-0191-01  人的素养主要包括身体素养、心理素养和社会文化素养,
近年来,脑电研究在国际学术界受到越来越多的重视,并展示出了重要的应用前景。脑电研究领域的两个关键问题是脑电正问题和脑电逆问题。脑电正问题是已知脑内的电流分布情况,
上市公司盈利预测信息是确定股票上市后股价走势的重要依据,它对投资者的投资行为具有引导作用。国外的盈利预测实证研究兴起于上世纪70年代末期,而国内这方面的研究还刚刚起
车辆优化调度问题是现代物流系统优化中关键的一环,也是开展电子商务活动中不可缺少的内容。对车辆优化调度理论与方法进行系统研究是构建综合物流系统、建立现代调度指挥系统
广播电视系统科技情报工作会议暨第三届情报网大会于1988年11月26日至29日在天津召开。参加会议的有41个单位53位代表。
随着计算机技术、通信技术以及控制技术的迅速发展,人们对信息社会和安全舒适的生活方式的需求不断增加,目前兴起的智能建筑的热潮,正是适应了这种社会信息化、生活舒适化与经济
【中图分类号】G635.5 【文献标识码】A 【文章编号】2095-3089(2015)05-0193-02  在全球经济一体化的背景下,教育国际化的趋势也越发明显。近些年,我国每年出国留学的人数逐年增加。据报道,2014年度我国出国留学人员总数达到了45.98万人,与2013年度的统计数据相比较,出国留学人数增加4.59万人,增长了11.09%。  在教育改革不断深化的背景下,我校自2013年起
半导体制造系统是公认的最复杂的生产系统之一。半导体晶圆生产调度与控制问题是比一般Flow Shop和Job Shop更复杂的第三类生产线控制问题。但由于半导体制造是高投资、高收