基于多Agent的并行Q-学习算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：mumuww

【摘要】

：

提出了一种多Agent并行Q-学习算法. 学习系统中存在多个Agent, 它们的学习环境、学习任务及自身功能均相同. 在每个学习周期内, 各个Agent在各自独立的学习环境中进行学习,

【作者】

：

周浦城洪炳韩学东郭耸

【机构】

：

哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001哈尔滨工程大学,计算机科学与技术学院,黑龙江,哈尔滨,150001;

【出处】

：

小型微型计算机系统

【发表日期】

：

2006年9期

【关键词】

：

强化学习 Q-学习融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种多Agent并行Q-学习算法. 学习系统中存在多个Agent, 它们的学习环境、学习任务及自身功能均相同. 在每个学习周期内, 各个Agent在各自独立的学习环境中进行学习, 当一个学习周期结束后, 对各个Agent的学习结果进行融合, 融合后的结果被所有的Agent共享, 并以此为基础进行下一个周期的学习. 实验结果表明了该方法的可行性和有效性.

其他文献

中国国家信息安全测评认证中心

中国国家信息安全测评认证中心是经国家授权,依据国家认证的法律、法规和信息安全管理的政策,按照国际通用准则建立的中立的技术机构,代表国家对信息技术、信息系统、信息安全产品以及信息安全服务的安全性实施测试、评估和认证,为社会提供相关的技术服务,向政府有关主管部门的信息安全行政管理和行政执法提供必要的技术支持。

期刊

中国国家信息安全管理安全测评认证中心信息安全服务信息安全产品主管部门行政执法行政管理信息系统信息技术技术支持技术机构技术服务国际通

一种结合亮度和粗糙度信息的舌像分割方法

期刊

瞬间·回放

期刊

春播镇压对淡黑钙土含水率影响的试验研究

采用二次正交旋转组合设计方法，建立了淡黑钙土土壤容重、含水率和种子发芽率的回归模型。并采取逐日跟踪监测的方法，描绘了不同镇压条件下种床土壤水分变动曲线。 A quadrati

期刊

淡黑钙土种床镇压含水率土壤容重发芽率

农药使用量零增长技术——活动我们在路上

为贯彻落实农业部种植业管理司的要求,1月12日吉林省农药技术推广总站和中国电信集团吉林分公司合作,正式启动了“吉林省农药零增长技术进万家宣传培训活动”.来自全省各市植

期刊

浅析建筑隔震工程施工措施

建筑隔震工程是指在隔震建筑中，与隔震技术相关的隔震层和隔离缝的统称。隔离缝是指将隔震层上部紻构与下部紻构、上部紻构与建筑周边完全分开的水平间隙和竖向间隙。由于隔震

期刊

建筑工程隔震工程技术

表彰·感言

期刊

市政道桥施工的出路--机械化

市政道路施工的出路在于机械化，社会的紷济发展突飞猛进，各项紷济发展个体都在积极的对自己的生产紷营方式进行改革，以求获得自身紷济收益的最大化，所以市政道路作为当前社会紷济

期刊

市政道桥施工机械化出路分析

密码化的中国文化(上)

中国是历史悠久的文明古国,不仅中华文化博大精深,而且科技先驱们也创造发明了许多具有世界先进水平的科技成果。本文从文化特征的角度,对汉文化中寓含的密码“因素”加以综

期刊

密码学中国中华文化文化特征科技成果读者创造发明知识性立意新可读性汉文化文明历史

基于BP神经网络的运动目标红外图像仿真

期刊

基于多Agent的并行Q-学习算法

其他学术论文