【摘 要】
:
将传统的强化学习应用到多智能体系统时,随着智能体个数的增加,存储规模呈指数级增长,加剧了强化学习本身的"维数灾难"问题,严重影响强化学习的性能,制约其实际应用.为此,本
【机 构】
:
中南大学信息科学与工程学院,长沙 410083
【出 处】
:
2010第六届全国多智能体系统与控制学术年会
论文部分内容阅读
将传统的强化学习应用到多智能体系统时,随着智能体个数的增加,存储规模呈指数级增长,加剧了强化学习本身的"维数灾难"问题,严重影响强化学习的性能,制约其实际应用.为此,本文以合作式多智能体系统为研究对象,提出一种基于行为预测的多智能体强化学习,将传统的强化学习分解为两个过程即行为预测过程和强化学习过程.一方面,这两个过程相互促进,达到传统的强化学习的效果;另一方面,通过分解,降低存储规模,缓解"维数灾难"问题.最后,通过合作搬运问题,验证了算法的有效性.
其他文献
该文给出了石油管道全景图系统设计与实现,实现石油管道周围环境的虚拟浏览.系统结构分为全景图制作、电子地图制作、数据发布、数据储存和系统显示五个模块.研究了全景图拼
小学生就像是田地里的幼苗,如果幼苗能够得到及时浇灌、拔草、施肥以及除虫,那么他们就能茁壮成长.如果幼苗生长在贫瘠的土壤里,且得不到充足的阳光、水分和营养,那么他们的
农村人民公社全体社员同志们!农村工作的全体干部同志们!各行各业各地区支援夏收的全体同志们:紧张的夏收战斗已经在陕南川道地区和关中东部地区开始了,再过几天,全省的夏收
初中阶段是学生优良品格与良好习惯养成的关键时期,由于初中生的心智尚未发育成熟,容易遭受各种思想、观念的影响,若没有及时予以正确引导,学生将可能误入歧途.道德与法治是
对Multi-Agent建模技术和复杂系统仿真技术运用于自动化立体仓库系统(AS/RS)中进行了研究,开展了自动化立体仓库系统的建模、优化与仿真,提出了以进一步完善仓储的智能化管理
We study the non-Markovian master equation used in cooling the mechanical resonator (MR) by quantum back-action.With a superconducting flux qubit as a speci
随着城市建设的发展,在既有铁路下修建地道逐漸增多,不少单位要求我们介绍这方面的有关资料。为此,本期刊登了北京局后勤组基建工程组总结的“顶管桥的设计与施工”一文。本
在初中学段教育中,学生已经具有了一定的学习基础,因此需要在基础之上增强学习能力,培养学习习惯,并能构建一定学科思维.在初中数学学习中,学生的知识掌握程度不同,又因为有
压力蒸汽灭菌工作是控制医院内感染的重要手段之一。落后的压力蒸汽灭菌器正逐渐被淘汰。我院自1984年开始应用程控下排气压力蒸汽灭菌柜(下简称程控排气柜)和程控预真空压
幼树要获得早结高产,可采用以下几项技术措施:1.培育早结高产的根系培育健壮侧根和须很是柑桔早结高产的基础,要使侧根和须根生长健壮,只有通过改良土壤,逐年深翻,环压绿肥,引