论文部分内容阅读
随着机器人技术的发展,移动机器人抓取结合机器视觉和多种传感器信息,并应用神经网络算法和控制理论算法使得机器人更加智能化,能够完成更加复杂的操作。但是移动抓取机器人并没有自我学习调整能力,如何使得机器人能够自我调整,拥有学习能力,这是一个热门研究方向。机器人的复杂的运动可以认为是由一系列简单的基元动作组合而成,动态运动基元是一种轨迹规划的方法,这种方法的目的是希望找到一种方式来表示复杂的运动动作,可以灵活地调整,而不需要手动参数调整或担心不稳定情况。强化学习算法是一种机器学习算法,它和监督学习不同,它不需要先验知识,而是通过不断试错与环境交互获的策略的改进方法,它具有自我学习和在线学习能力。本文用动态运动基元算法结合强化学习算法,让机器人能够对动态运动基元的参数更新,实现对规划的轨迹自我调整学习。本文的移动抓取机器人为实验室自主研发,拥有5个自由度的仿生机械臂(双臂),6个自由度的仿生机械手(左右手),和能够移动的双轮(视为两个自由度),形成了一个可以移动抓取的机器人手眼系统。机器人安装的双目摄像头获得目标物体的坐标,在视觉引导下能够避免移动操纵臂的任务空间奇异点,利用原对偶神经神经网络算法对移动机器人冗余度问题进行优化,得到末端轨迹和每个关节的轨迹,这里只取到达目标点位置时的每个关节位置。把得到的目标点作为动态运动基元算法的目标点,产生期望轨迹,机械臂进行跟踪目标轨迹,结合强化学习算法对运动基元算法的参数进行学习训练,在一定次数学习之后,仿生机械臂能比较精准的到达目标位置。在最后的抓取环节,通过手指与物体之间的接触力实现稳定的抓取。在视觉反馈下确定抓取点,根据抓取位置的不同,利用递归神经网络算法进行力的优化分配。本文通过视觉引导定标,利用原对偶神经网络求解移动机器人在任务空间的冗余度问题,然后利用运动基元算法产生期望曲线,用强化学习算法学习训练运动基元参数,最后进行抓取时,用递归神经网络进行抓取力优化,最终完成抓取任务。