【摘 要】
:
移动机器人在复杂环境中移动难以得到较优的路径,基于马尔可夫过程的Q学习(Q-learning)算法能通过试错学习取得较优的路径,但这种方法收敛速度慢,迭代次数多,且试错方式无法应
【机 构】
:
南京理工大学机械工程学院,南京理工大学计算机科学与技术学院
论文部分内容阅读
移动机器人在复杂环境中移动难以得到较优的路径,基于马尔可夫过程的Q学习(Q-learning)算法能通过试错学习取得较优的路径,但这种方法收敛速度慢,迭代次数多,且试错方式无法应用于真实的环境中。在Q-learning算法中加入引力势场作为初始环境先验信息,在其基础上对环境进行陷阱区域逐层搜索,剔除凹形陷阱区域Q值迭代,加快了路径规划的收敛速度。同时取消对障碍物的试错学习,使算法在初始状态就能有效避开障碍物,适用于真实环境中直接学习。利用python及pygame模块建立复杂地图,验证加入初始引力势场和陷
其他文献
中共中央印发的《关于加强党的政治建设的意见》明确规定,不得搞任何形式的“低级红”“高级黑”,这是中央对这种阳奉阴违“伪忠诚”的政治两面派行为的严令制止。全党必须高
“老郭,最近工作、身体咋样?今天我们来,是代表省委、省纪委监委对你进行一次回访……”日前,辽宁省纪委监委第四纪检监察室主任宫良学来到某省属高校,对一名因涉嫌拉票贿选案受到处分的干部进行了回访。 “刚受处分时,总觉得自己身上有污点,抬不起头来,没想到组织上对我们这样关怀,鼓励我们放下包袱,做好工作。今后我一定要端正思想认识,努力工作,作出成绩,用实际行动回报党组织的关怀。”这名受处分的干部如释重
著名教育家苏霍姆林斯基说:“在教学大纲和教科书中,规定了给予学生各种知识,却没有给予学生最重要的东西,这就是──幸福。理想的教育是:培养真正的人,让每一个从自己手里培
本文基于社会网络理论,分析优化健康知识传播的社会网络要素及城市老年人群社会网络结构特点。结果显示,城市老年人群的交往存在区域性,区域内老年群体社会网络的网络密度较
目的:探讨丹参注射液联合曲安奈德局部注射治疗口腔黏膜下纤维性变(OSF)临床疗效及对血清转化生长因子-β1(TGF-β1)、白细胞介素-6(IL-6)的影响。方法:选取2015年10月~2016
“成绩都是过去的事情了,咱们还得往前看,这是对我的一种肯定,将会成为我今后进步的动力,鞭策我继续努力!”李峰,现为北京建工四建重庆分公司京东方嘉泰罗厂房工程项目经理。
分别从弯沉传感器的位置、负载级别、检测位置、检测间隔、现场数据质量检查,反算分析等方面介绍了落锤式弯沉仪(FWD)在路面结构检测中的应用。
梯田既是一种农耕方式,也是一种历史悠久的农耕文化景观。近几年来,越来越多的学者开始关注和研究梯田文化及其传承保护与开发利用问题。研究内容涉及梯田的起源与发展、梯田
沈阳警备区紧扣精准理念,紧贴地域实际,细化方法步骤,倾心打造脱贫攻坚中的“军队样本”,赢得当地干部群众的交口称赞。 沈阳警备区将扶贫工作纳入党委工作日程,纳入地方统一规划,按照“拔穷根、播希望、高精准”的扶贫理念,制定“一年打基础、两年抓提升、三年出成效”的总目标,一步一动,实现精准帮扶。 作为地方党委的“军事部”和协调驻军的“桥头堡”,沈阳警备区积极发挥军地协调作用,在沈阳市扶贫帮困统一