论文部分内容阅读
随着移动机器人系统的进一步发展,以及3D成像技术的不断融合,使得视觉同步定位与建图(视觉SLAM,Simultaneously Localization And Mapping)受到了政府、社会、企业的高度重视,更是吸引了相关产业链与环节众多厂家的积极参与。视觉SLAM通过不同的特定摄像头获取图像信息,以达到在没有环境先验信息的情况下,实现运动过程中建立环境并估计自身运动等功能。在复杂环境的干扰下,如何保证并提升移动机器人的建图准确性是视觉SLAM产业化过程的关键应用基础问题。智能移动机器人在环境未知的情况下通过机器人本身位置和视觉传感器进行运动估计,同时能智能地定位自身的位置和建立机器人周围的环境地图,这个过程被称为SLAM,即同时定位与地图构建。相比于激光SLAM,视觉SLAM的结构更加简单、轻便,并且无传感器探测距离限制、成本低、可提取语义信息,有着相当可观的市场前景,因此视觉SLAM已成为当今各产业重点关注的一大目标。视觉SLAM主要分为五大部分:传感器数据、视觉里程计、后端优化、回环检测以及最终建图。这五大部分各个息息相关,例如智能移动机器人在视觉里程计过程中,会不断累积误差,无论这个误差是视觉传感器或是人工误差,都会造成这个结果,这是无法避免的。此时便需要通过回环检测,对机器人进行整个地图的检测,当检测到回环效果时,就可以通过回环位置来缩小建图的误差,以此来增加整个地图的鲁棒性和准确性。传统的回环检测方法主要为词袋算法(Bo W,Bag of Words),这种方法较为简洁,整个过程和实验结果也较好,但由于此方法需要大量通过人为设置特征来完善算法,因此这大大限制了整个SLAM的效果,并且此方法在光照变化明显时效果偏差,所以需要提出一种新的思路来进行回环检测的研究。目前,深度学习的技术已经在很多方面利用上了,它们主要应用于图像分类、数据拟合等,而回环检测从原则上讲就是一种图像的分类过程,所以将深度学习技术应用到回环检测当中,理论上是一种可行而更有效的方法。本文提出将深度学习中的多种卷积神经网络(CNN,Convolutional Neural Networks)应用于视觉SLAM回环检测当中,本人将CNN网络看作图像处理器,因此只关心处理器的输入和输出,通过不同的CNN网络,得到它们各自的输出。本人设定输出必须为一维向量,随后对输出进行处理,得到更有效而简洁的数据,最终对这些数据进行回环检测相似性对比,通过多种方式给出相应结果。本文为视觉SLAM的研究提出一种新的回环检测方法,具有一定的创新性,主要研究工作和成果如下:1.本文描述了视觉SLAM的五大部分,其中包括传感器数据、视觉里程计、后端优化过程、回环检测、建图。并着重介绍了视觉SLAM回环检测的相关理论。2.本文阐述了视觉SLAM运动估计的数学描述以及回环检测传统Bo W方法理论,主要通过描述视觉SLAM中机器人运动与观测过程中的数学理论,得到相应的运动模型和观测模型,从而得到整个SLAM的问题求解。3.本文对基于人工设计特征(Bo W)的回环检测算法进行了具体描述,分析了特征描述子的一系列方法,主要包括SIFT、SURF和ORB,其中主要阐述了ORB算法的细节。并介绍了Bo W算法的整个实现方法,包括了传统Bo W算法的形成、Bo W回环检测的算法过程等,并进行了实验,将实验结果通过多项数据表示,由此充分地展示出传统Bo W回环检测算法的优点和缺点。4.本文提出将深度学习与视觉SLAM相互结合,从而将多种CNN网络应用在视觉SLAM回环检测上,并给出了实验用的回环检测改进方法:经过不同CNN架构的训练,并对输出数据进行归一化、PCA、白化等处理,随后使用标准化的欧式距离来计算两个图像之间的距离信息,最后在标准的New College和City Centre数据集上进行实验。实验将传统基于人工设计特征的算法(Bo W)与几种CNN模型的改进前后方法进行对比,从实验结果上看,本文采用改进后的算法中,多种CNN网络在回环检测的相似矩阵、PR曲线、平均准确率和特征提取时间性能上都具有较好的优势。