基于多Agent的并行Q-学习算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:mumuww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种多Agent并行Q-学习算法. 学习系统中存在多个Agent, 它们的学习环境、学习任务及自身功能均相同. 在每个学习周期内, 各个Agent在各自独立的学习环境中进行学习, 当一个学习周期结束后, 对各个Agent的学习结果进行融合, 融合后的结果被所有的Agent共享, 并以此为基础进行下一个周期的学习. 实验结果表明了该方法的可行性和有效性.
其他文献
中国国家信息安全测评认证中心是经国家授权,依据国家认证的法律、法规和信息安全管理的政策,按照国际通用准则建立的中立的技术机构,代表国家对信息技术、信息系统、信息安全产品以及信息安全服务的安全性实施测试、评估和认证,为社会提供相关的技术服务,向政府有关主管部门的信息安全行政管理和行政执法提供必要的技术支持。
期刊
期刊
采用二次正交旋转组合设计方法,建立了淡黑钙土土壤容重、含水率和种子发芽率的回归模型。并采取逐日跟踪监测的方法,描绘了不同镇压条件下种床土壤水分变动曲线。 A quadrati
为贯彻落实农业部种植业管理司的要求,1月12日吉林省农药技术推广总站和中国电信集团吉林分公司合作,正式启动了“吉林省农药零增长技术进万家宣传培训活动”.来自全省各市植
期刊
建筑隔震工程是指在隔震建筑中,与隔震技术相关的隔震层和隔离缝的统称。隔离缝是指将隔震层上部紻构与下部紻构、上部紻构与建筑周边完全分开的水平间隙和竖向间隙。由于隔震
期刊
市政道路施工的出路在于机械化,社会的紷济发展突飞猛进,各项紷济发展个体都在积极的对自己的生产紷营方式进行改革,以求获得自身紷济收益的最大化,所以市政道路作为当前社会紷济
中国是历史悠久的文明古国,不仅中华文化博大精深,而且科技先驱们也创造发明了许多具有世界先进水平的科技成果。本文从文化特征的角度,对汉文化中寓含的密码“因素”加以综
期刊