引入势场及陷阱搜索的强化学习路径规划算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：yo55an

【摘要】

：

移动机器人在复杂环境中移动难以得到较优的路径,基于马尔可夫过程的Q学习（Q-learning）算法能通过试错学习取得较优的路径,但这种方法收敛速度慢,迭代次数多,且试错方式无法应

【作者】

：

董培方张志安梅新虎朱朔

【机构】

：

南京理工大学机械工程学院,南京理工大学计算机科学与技术学院

【出处】

：

计算机工程与应用

【发表日期】

：

2018年16期

【关键词】

：

路径规划强化学习人工势场陷阱搜索 Q值初始化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

移动机器人在复杂环境中移动难以得到较优的路径,基于马尔可夫过程的Q学习（Q-learning）算法能通过试错学习取得较优的路径,但这种方法收敛速度慢,迭代次数多,且试错方式无法应用于真实的环境中。在Q-learning算法中加入引力势场作为初始环境先验信息,在其基础上对环境进行陷阱区域逐层搜索,剔除凹形陷阱区域Q值迭代,加快了路径规划的收敛速度。同时取消对障碍物的试错学习,使算法在初始状态就能有效避开障碍物,适用于真实环境中直接学习。利用python及pygame模块建立复杂地图,验证加入初始引力势场和陷

其他文献

警惕“低级红”“高级黑”

中共中央印发的《关于加强党的政治建设的意见》明确规定,不得搞任何形式的“低级红”“高级黑”,这是中央对这种阳奉阴违“伪忠诚”的政治两面派行为的严令制止。全党必须高

期刊

政治建设中共中央政治辨别力客观实际伪忠诚免疫力“红”欺骗性

持续净化修复政治生态

“老郭，最近工作、身体咋样？今天我们来，是代表省委、省纪委监委对你进行一次回访……”日前，辽宁省纪委监委第四纪检监察室主任宫良学来到某省属高校，对一名因涉嫌拉票贿选案受到处分的干部进行了回访。　　 “刚受处分时，总觉得自己身上有污点，抬不起头来，没想到组织上对我们这样关怀，鼓励我们放下包袱，做好工作。今后我一定要端正思想认识，努力工作，作出成绩，用实际行动回报党组织的关怀。”这名受处分的干部如释重

期刊

政治生态辽宁省委纪委书记跟踪回访

让学生成为音乐课的主人

著名教育家苏霍姆林斯基说:“在教学大纲和教科书中,规定了给予学生各种知识,却没有给予学生最重要的东西,这就是──幸福。理想的教育是:培养真正的人,让每一个从自己手里培

期刊

音乐教学方法音乐课堂教学朋友来相会

基于社会网络理论的城市老年健康教育优化设计

本文基于社会网络理论,分析优化健康知识传播的社会网络要素及城市老年人群社会网络结构特点。结果显示,城市老年人群的交往存在区域性,区域内老年群体社会网络的网络密度较

期刊

老年人健康教育社会网络知识传播

丹参注射液联合曲安奈德局部注射治疗OSF的疗效及对血清TGF-β1、IL-6的影响

目的:探讨丹参注射液联合曲安奈德局部注射治疗口腔黏膜下纤维性变(OSF)临床疗效及对血清转化生长因子-β1(TGF-β1)、白细胞介素-6(IL-6)的影响。方法:选取2015年10月~2016

期刊

口腔黏膜下纤维性变丹参注射液曲安奈德局部注射TGF-β1IL-6

乐对历练:战斗里成长——记北京建工四建重庆分公司项目经理李峰

“成绩都是过去的事情了,咱们还得往前看,这是对我的一种肯定,将会成为我今后进步的动力,鞭策我继续努力!”李峰,现为北京建工四建重庆分公司京东方嘉泰罗厂房工程项目经理。

期刊

北京建工集团

落锤式弯沉仪(FWD)在路面结构检测中的应用

分别从弯沉传感器的位置、负载级别、检测位置、检测间隔、现场数据质量检查,反算分析等方面介绍了落锤式弯沉仪(FWD)在路面结构检测中的应用。

期刊

落锤式弯沉仪路面结构检测应用

梯田文化及其旅游开发研究综述

梯田既是一种农耕方式,也是一种历史悠久的农耕文化景观。近几年来,越来越多的学者开始关注和研究梯田文化及其传承保护与开发利用问题。研究内容涉及梯田的起源与发展、梯田

期刊

农耕文化梯田文化乡村旅游哈尼梯田紫鹊界梯田

绘制扶贫帮困的幸福蓝图

沈阳警备区紧扣精准理念，紧贴地域实际，细化方法步骤，倾心打造脱贫攻坚中的“军队样本”，赢得当地干部群众的交口称赞。　　沈阳警备区将扶贫工作纳入党委工作日程，纳入地方统一规划，按照“拔穷根、播希望、高精准”的扶贫理念，制定“一年打基础、两年抓提升、三年出成效”的总目标，一步一动，实现精准帮扶。　　作为地方党委的“军事部”和协调驻军的“桥头堡”，沈阳警备区积极发挥军地协调作用，在沈阳市扶贫帮困统一

期刊

贫困村孙家屯

引入势场及陷阱搜索的强化学习路径规划算法

其他学术论文