论文部分内容阅读
三维拼接与可视化是获取准确而全面的三维模型的重要研究课题。由于三维采集设备的限制,单次采样只能获得场景或物体的局部三维信息,需要使用三维拼接将局部三维信息拼接为全局三维模型。经过三维拼接的三维数据通过有效的可视化方法,可以展现在显示屏幕上,便于观察和后续研究。 本研究采用了基于双目立体视觉的方法对三维数据进行采集,并使用基于视觉的方法进行三维拼接及融合处理。目前,基于双目立体视觉获取全局三维信息的应用往往需要较大的时间开销难以满足自动驾驶及机器人自主行走的要求。本文提出了完全基于双目图像序列的全局室外场景的三维模型建立方法。主要的研究内容集中于双目立体视觉系统中的三维数据获取、三维拼接、三维融合以及三维可视化等方面。 在三维数据获取方面,本文首先介绍了双目立体成像模型,并对相机进行了标定和校正使得获取的图像符合平行式双目成像模型。随后,本文使用了大规模有效立体匹配的方法对视差进行求解,再利用三角测量法得到局部三维数据。 在三维拼接方面,本文引入了视觉里程计来求解局部三维数据间的空间转换。本文对基于特征的双目视觉里程计进行了改进,针对高分辨率大场景图像提出了高效的特征检测与描述方法,并且设计了较为鲁棒的特征匹配方法。随后,通过运动估计获得了相应的空间转换。本方法经过测评在精度和效率上都有一定的优势。 在三维融合方面,本文提出了重投影模型对三维数据的重叠区域进行确定并进行融合。将已经获取到的三维数据利用重投影模型投影至二维平面,通过二维与三维数据的内在联系对三维数据进行融合。同时利用贪婪算法的思想,融合问题进行了有效的简化,提高了处理的效率。 在三维可视化方面,本文利用计算机图形学的基本原理,采用点模型对三维数据进行了可视化。在可视化过程中,使用了OpenGL对可视化整个过程进行了实现并设计了简单的交互。本文的可视化能够较好的展现三维数据的本身特性,并将大数据量的三维地图展示在了屏幕上。 本文的研究不仅为自动驾驶及机器人自主行走提供了全面的三维地图,更为仅仅依靠双目图像序列获得全面而准确的三维模型奠定了基础。实验结果表明,本文的方法在效率和精度上表现优异,基本达到了实时的要求。本文所得到的全局三维模型,可以用于后续三维目标的检测与识别及语义分析中。