论文部分内容阅读
计算图像中三维物体的姿态(旋转和平移)并在时序上连续跟踪目标三维物体的姿态是很多计算机视觉应用的关键任务。比如为了把虚拟信息渲染或叠加到现实世界中特定的三维物体上,增强现实系统必须知道特定三维物体的姿态;为了驱动机械臂抓取感兴趣三维物体,机器人系统同样也需要时刻跟踪特定三维物体并计算出物体的姿态。三维物体跟踪是计算三维物体姿态并对姿态进行跟踪的重要手段。现有多种技术可以现实三维物体跟踪:机械式跟踪设备跟踪精度高,但工作空间受限;电磁、惯性或超声波等跟踪设备易受环境因素干扰,并且需要附着或侵入物体。基于视觉的三维跟踪技术是一种非侵入式、准确廉价的解决方案,随着移动设备计算能力的增强、便携式穿戴设备的发展普及,单目彩色相机下三维物体跟踪技术在制造、医疗、教育和娱乐等行业应用中备受重视。单目三维物体跟踪的目标是在时序上连续地估计物体相对于相机的姿态。虽然在近几十年里科研人员对三维物体跟踪技术进行了孜孜不倦的研究,提出了诸多方法,但是三维物体跟踪依旧是充满挑战的研究问题,上述挑战主要源自包括无纹理物体、复杂背景、遮挡或快速运动等棘手的因素,特别是单目三维物体跟踪,因其仅利用了现实场景的颜色或灰度信息。无纹理物体缺乏判别性的特征,复杂背景会对三维跟踪算法中的姿态优化产生干扰。同时,遮挡和快速运动是大部分计算机视觉任务面临的难题。考虑到日常生活中单目彩色相机非常普遍,例如手机摄像头和监控摄像头;而且大部分人造物品是无纹理的,例如工业零部件、冰箱和空调等,本文重点关注单目彩色相机下无纹理三维物体跟踪问题。首先,研究基于边缘距离场优化的无纹理三维物体跟踪问题;其次,研究边缘方向验证机制在无纹理三维物体跟踪过程中融合问题;最后,研究去除复杂背景边缘和前景内部边缘干扰,实现实时稳定的无纹理三维物体跟踪方法。本文的主要贡献如下:1.提出一种基于边缘距离场姿态优化的无纹理三维物体跟踪方法。已有的方法显式地搜索三维点和二维点之间的点对应,不可避免地会产生单独的错误的点对应。本文提出的方法旨在最小化预测的物体轮廓和当前图像中边缘的全局距离。本文方法可以在边缘距离场中直接优化求解物体的三维姿态。为了避免求解算法收敛到局部极小值,并使算法能够处理可能的帧间剧烈运动,使用了带一阶自回归状态动力学的粒子滤波框架。同时为了处理遮挡,在能量方程中加入了鲁棒估计算法。在具有遮挡和剧烈运动的图像序列上,本文方法与两种现有先进的方法作了对比,同时也给出了量化结果,证明了本文方法的有效性。2.提出一种基于姿态验证和恢复的鲁棒无纹理三维物体跟踪方法。首先引入一种基于边缘距离场的姿态估计方法。给定良好的初始姿态,该方法能准确收敛到最优姿态。然而,该方法对遮挡和快速运动非常敏感,为了提升鲁棒性,本文使用边缘方向一致性来验证求解姿态的准确性,并进一步将验证机制融合到鲁棒估计、非局部搜索和错误恢复的过程中。鲁棒估计采用逐点验证来抑制外点的影响,由此导出了一种基于边缘方向一致性的鲁棒估计算子。非局部搜索基于粒子滤波,使用边缘方向一致性分数为粒子计算可靠的权重。错误恢复基于快速二维物体检测,通过搜索3D-2D对应点估计恢复的姿态,使用边缘方向一致性分数自适应地进行系统状态转换。现实序列上的对比试验证明了本文方法的有效性。3.提出并实现了实时稳定的基于模型的单目无纹理三维物体跟踪方法。方法的原型系统通过验证姿态一致性分数实现在初始化,跟踪和错误恢复三种状态之间切换。在初始化姿态下系统将三维几何模型投影到二维图像,通过最小化投影轮廓和图像边缘的距离,迭代优化得到物体的最优姿态。图像序列或视频的第一帧物体姿态来自预设,后续的每一帧的初始姿态通过前一帧的姿态加上运动模型得到。为了处理帧间快速运动或物体出入视野导致的跟踪丢失,系统采用了基于关键帧为模板的快速物体检测算法进行跟踪失败后的姿态恢复。为了降低复杂背景的干扰,本文提出了基于颜色的边缘分类算法,去除非物体轮廓的边缘对姿态优化的干扰。