基于强化学习与动态运动基元的移动机器人抓取研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wanglyyou66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器人技术的发展,移动机器人抓取结合机器视觉和多种传感器信息,并应用神经网络算法和控制理论算法使得机器人更加智能化,能够完成更加复杂的操作。但是移动抓取机器人并没有自我学习调整能力,如何使得机器人能够自我调整,拥有学习能力,这是一个热门研究方向。机器人的复杂的运动可以认为是由一系列简单的基元动作组合而成,动态运动基元是一种轨迹规划的方法,这种方法的目的是希望找到一种方式来表示复杂的运动动作,可以灵活地调整,而不需要手动参数调整或担心不稳定情况。强化学习算法是一种机器学习算法,它和监督学习不同,它不需要先验知识,而是通过不断试错与环境交互获的策略的改进方法,它具有自我学习和在线学习能力。本文用动态运动基元算法结合强化学习算法,让机器人能够对动态运动基元的参数更新,实现对规划的轨迹自我调整学习。本文的移动抓取机器人为实验室自主研发,拥有5个自由度的仿生机械臂(双臂),6个自由度的仿生机械手(左右手),和能够移动的双轮(视为两个自由度),形成了一个可以移动抓取的机器人手眼系统。机器人安装的双目摄像头获得目标物体的坐标,在视觉引导下能够避免移动操纵臂的任务空间奇异点,利用原对偶神经神经网络算法对移动机器人冗余度问题进行优化,得到末端轨迹和每个关节的轨迹,这里只取到达目标点位置时的每个关节位置。把得到的目标点作为动态运动基元算法的目标点,产生期望轨迹,机械臂进行跟踪目标轨迹,结合强化学习算法对运动基元算法的参数进行学习训练,在一定次数学习之后,仿生机械臂能比较精准的到达目标位置。在最后的抓取环节,通过手指与物体之间的接触力实现稳定的抓取。在视觉反馈下确定抓取点,根据抓取位置的不同,利用递归神经网络算法进行力的优化分配。本文通过视觉引导定标,利用原对偶神经网络求解移动机器人在任务空间的冗余度问题,然后利用运动基元算法产生期望曲线,用强化学习算法学习训练运动基元参数,最后进行抓取时,用递归神经网络进行抓取力优化,最终完成抓取任务。
其他文献
奚迭剌部为辽太祖诸部之一,又作迭剌迭达部。本文对其部名及其所居地点予以考证,认为奚迭剌部即奚耶律部,居于辽饶州一带。同时对有的学者提出的奚迭剌部即"奚铁勒部或奚铁骊
历史上,辽朝曾经设立了两个"中京",即镇州和后来的中京大定府。镇州成为中京不久之后,即再度落入中原王朝之手,时间仅隔数日。圣宗统和二十四年中京大定府建成以后,在事实上
在分析了甘肃礼县盐关井水位20多年来的异常变化与邻近地区发生中强地震的对应关系基础上,着重就18年来井水位出现两次较大幅度的负异常与相距1000 km多的云南禄劝1985年6.1级地震和云南大姚2003年6.2级地震的对应关系进行了探讨,认为该井很可能是滇北两个震区强震的“穴位”和灵敏点。
<正>宁城大明塔位于今内蒙古自治区赤峰市宁城县大明镇辽中京遗址内城的正南门阳德门外东侧。辽中京遗址俗称大明城,因此人们习惯上称此塔为大明塔。该塔筑于高约5米的夯土台
S方法将同一测期一条流动地磁测线各测点的变化叠加,可抑制单个测点的干扰,使可能存在的震磁异常信息凸现。本文研究了安徽省流动地磁测线S异常与邻近地区小震震群活动频次和中强地震的关系;探讨了"震情窗"地区S异常与"震情窗"相关地区中强地震的相关性;讨论了同一测期流动地磁测线各测点δf"同向变化"现象。
2010年盛夏,骄阳似火,我有幸随同在赤峰召开的辽吉蒙地震联防协作区年会的与会人员前往宁城县考察地震遗址,拜谒大明塔,感受辽中京深厚的文化底蕴,饱览辽代丰富的文化遗产。
自主移动机器人拥有在其所处的环境中运动的能力,能够不在人影响的情况下完成自主导航的任务。近年来,强化学习越来越多的应用于移动机器人自主导航,以提高移动机器人对连续
<正> 赤峰地区是契丹族的发祥地。解放以来在赤峰地区发现了多处辽代的城址,这些城址从性质上看,有京城、州、县、头下州、奉陵邑等不同类型。本文以赤峰地区目前所发现的几