MAXQ算法相关论文
本文以足球仿真机器人系统为研究平台,研究多智能体对抗系统的高层策略学习问题。通过对足球机器人系统的分析和研究,使用模糊手段描......
具有抽象机制的分层强化学习方法可以实现状态空间的降维,从而解决大规模系统中的“维数灾”问题。由于引入了状态抽象机制,分层强......

