论文部分内容阅读
三维重建(3D Reconstruction)是指对物体建立适合计算机表示和处理的三维模型,是在计算机环境下对其进行分析、处理和操作的基础。三维重建技术提供三维模型结构用于对三维信息的识别和认知。三维重建是计算机视觉的重要研究领域,同时还涉及计算机图形学、数字图像处理、模式识别和人工智能等学科。 RGB-D相机是一种可以同时获得颜色信息和深度信息的传感器。RGB-D相机作为新近涌现的硬件设备,诸如Microsoft Kinect、Asus Xtion等,同传统三维扫描设备相比,具有价格低廉、结构小巧、使用方便,且能实时捕获物体表面的深度与彩色信息等优点。RGB-D相机为计算机视觉、计算机图形学等领域的相关研究提供了一种新的手段,在三维重建领域受到了广泛的关注。 利用深度相机进行室内场景三维重建,存在两大问题需要解决。第一,深度相机普遍存在获取深度信息分辨率低、噪声大的缺陷。第二,要多次获取场景数据。一般为了得到一个完整的三维场景数据,需要对目标场景进行多达数千帧的从不同视角深度点云数据获取。为了重建场景表面各个角度完整的几何信息,需要对多视角捕获的深度数据进行配准。而对包含噪的大量深度序列数据的配准,仍然是一个被广泛关注的研究难题。 基于上述背景,本文首先研究相机姿态估计方法方法,优化相机运动姿态估计使其更加贴近真实值;然后研究深度序列合成方法,实现重建室内场景模型。具体的研究成果如下: (1)提出一种使用平面基元的帧间配准算法 现有的配准算法中,仅使用深度数据的配准方法,对深度数据缺乏但颜色丰富的情况配准效果不好。在同时定位与地图创建(SLAM,Simultaneous localization and mapping)方法中,将颜色信息引入帧间配准算法,提高了算法的鲁棒性,但是对于较大基线距离的情况,特征匹配较困难。 针对上述问题本文提出一种使用平面基元的帧间配准算法,相比于颜色特征点,平面匹配对更不容易受到测量误差的影响,同时可应对较大基线距离等情况,使得配准结果更加鲁棒。实验结果表明,本文方法在相机姿态估计中带来了比RGBD-SLAM方法更好的结果,相比RGBD-SLAM方法平均绝对路径误差减少25%,更接近相机运动的真实姿态。 (2)提出了一种基于指数权重函数TSDF体重建方法 由于SLAM方法偏重于相机姿态估计,在模型表示上,大多使用点云表示。而融合多帧的点云数据存在着数据量巨大、数据冗余且存在噪声点等问题;Kai等人提出了一种使用八叉树表示空间占用的方法,该方法虽然解决了数据冗余和数据量巨大的问题,但生成的场景模型存在明显的棱角,存在模型表示不直观等缺陷。截断符号距离函数(TSDF,Trancate Signed Distance Function)体方法较好的解决了重建模型存在棱角问题,但是由于kinect深度数据存在测量误差,部分深度数据存在畸变,该方法仍然无法有效处理有畸变的点云数据。 本文使用TSDF体方法表示场景模型并针对深度数据存在畸变问题,提出了一种指数权重函数,解决深度畸变对重建模型的影响。实验结果表明,本文提出的改进方法,有效的减少了噪声与畸变对模型的影响,提高了场景重建效果,在Stanford数据集中也取得了很好的建模效果。