基于RGB-D相机的高精度实时轻量级SLAM

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:shmilyuho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人驾驶技术是一个庞大且复杂的系统性工程,但其核心始终离不开传感器、定位与导航技术。全球定位系统(CPS)作为目前主流的定位技术无法满足厘米级的定位和避障,且在室内和城市中无法做到全覆盖。而基于计算机视觉的定位技术很好的补充了 GPS这一短板。同步定位与建图(SLAM)旨在实现三维场景重建以及成像传感器的相机位姿估计。目前主流的SLAM算法对计算性能的要求较高,往往需要高性能图形处理单元(GPU)加速才能实现高精度和高帧率的实时运行。由于体积和功耗的限制,这不利于SLAM算法在便携设备上的普及。因此本课题将对SLAM算法进行研究,并针对移动设备对其作出改进,提高精度的同时减少了计算量。主要研究工作如下:1)对比目前主流的SLAM系统。设计了最适合室内移动设备使用的整体框架。采用RGB-D作为输入,使用直接法进行位姿估计,利用回环检测方法去除SLAM系统的漂移现象,利用SLAM的稀疏性,使用光束平差法对全局进行优化。深入学习SLAM系统每个部分的数学原理,研究SLAM系统精度和速度的影响因素,找到关键参数,针对移动设备进行针对性的优化。2)RGB-D图像的预处理。预处理使深度图变得平滑,一些噪声和较大的深度值将被去除。常用的算法是双边滤波,然而该方法的计算量较大,不适合用在移动设备中,本课题对预处理进行了改进,对比不同的图像降噪算法对在深度图中的效果,以及最终反映到定位精度和速度的影响。最终在不降低精度的情况下将预处理的时间降低了 87%。3)关键帧选择方法。当新的图像与最新的关键帧相差过大时,必须创建新的关键帧。关键帧的选择对平衡系统精度和速度至关重要,关键帧选择方法旨在确定合适的关键帧密度。如果机器人的速度很慢,则帧会很密集,应提取较少的关键帧。如果机器人的速度很快,则图像稀疏,应提取更多的关键帧。另外,如果使用过多的关键帧,则会浪费计算量。但是,如果使用的关键帧太少,则准确度会过低。本课题提出了一种新的关键帧选择方法。考虑到SLAM系统对于纯旋转运动更为敏感,在关键帧选择方法的判断机制中加入了旋转和平移的分量。并对其进行测试以确定最佳值。经过实验测试,证明该方法有效地平衡了系统的准确性和速度。4)在系统后端的BA优化中野值的抑制。野值在SLAM系统中非常普遍,往往是由于移动的对象或阴影的变化造成的。需要在优化之前使用Tukey Biweight鲁棒核函数对其影响进行抑制。针对移动设备和室内场景对鲁棒核函数进行了优化,在不影响速度的前提下,提高了精度。最终对改进后的系统进行了仿真和实验,与同一公共基准数据集中的最新方法进行了比较,实验证明整体的改进在原有的系统上得到了 13%的速度提升和12%的精度提升。
其他文献
近年来,随着智慧城市的不断建设,目标跟踪越发重要。视觉目标跟踪需要在视频序列的每一帧实现对目标的定位与跟踪。复杂环境及目标自身变化等问题是目标跟踪技术面临的困难。因此,视觉目标跟踪领域的重点任务就是研究具有较高精确度与稳定性与目标跟踪算法。相关滤波类跟踪算法由于兼具高速与高精确度,受到了学者们的广泛关注和研究。然而,现有相关滤波类跟踪算法仍存在以下问题:一是边界效应会使训练样本对目标表示偏离真实,
[db:内容简介]
随着无人机技术的发展,无人机拍摄在航空摄影,地形测绘,军事侦察等方面具有广泛的应用前景。本文主要研究无人机俯拍视频中的目标识别问题,分析现有的运动目标识别方法,提出融合目标跟踪与图像识别的运动目标识别方法。以无人机俯拍视频中的运动目标作为研究对象,进行跟踪标定及分类识别。针对识别方法的实时性问题,提出基于数据去冗余的改进方法,通过仿真实验验证基于视频流的无人机目标识别方法。本文主要研究内容如下:(
图像质量评价在数字图像处理技术中占据着重要地位,分为主观图像质量评价和客观图像质量评价两种。主观图像质量评价需要消耗大量的人力,且无法嵌入到实时应用的系统中去,因此需要研究能够适用于多种场合的客观图像质量评价方法。客观图像质量评价方法分为全参考、部分参考和无参考三种。在多数情况下,参考图像难以获得,因此无参考图像质量评价方法具有更广泛的应用场景。无参考图像质量评价算法BRISQUE(Blind/R
数字图像是大数据时代人类感知与传播信息的重要载体,在数字图像产生与保存的过程中会引入不同程度的噪声,图像质量差会对信息的获取产生很大的影响,使得后续对于图像的处理存在极大的不确定性,阻碍图像处理技术的发展。图像技术在多领域的普遍应用,使得数字图像质量增强技术的研究已经成为图像处理方面十分具有现实意义的内容,图像去噪作为进行图像研究的预处理问题,具有十分深远的意义。图像去噪判别模型由于其良好的去噪性
受到传感器成像机理与材料工艺的限制,由传感器采集到的单一类型图像数据难以全面、准确、清晰地描述场景中的信息。多源成像传感器可提供同一场景下类型不同的图像数据。多源图像融合技术的目的是尽最大可能提取来自多源信道图像数据的互补信息,生成包含更多场景信息的融合图像。现阶段,多源图像融合技术在数码摄像、视频监控、医疗诊断和遥感目标检测等领域得到了广泛应用。本文针对多聚焦图像融合和红外与可见光图像融合中信息
随着深度学习的发展,人工智能对人类社会生活带来了很大的便利。视频文本描述作为视频内容分析的重要分支,推动着视频检索与视频个性化推荐的进一步发展。视频文本描述算法需要对视频中包含的视觉内容使用自然语言进行文本描述,且要求该描述语句具有准确性、可读性与流畅性。目前在基于编解码模型的视频文本描述算法的研究中,将视频高级语义信息作为视频语义特征,能够有效地辅助解码模型更准确的将视频视觉特征转化为文本描述。
面部表情识别在情感计算中占有重要地位,已被广泛应用于人机交互、驾驶者异常监测、疼痛估计、远程教育等领域。人类表达情感的方式并不相同,即使传递同一种情感,面部表情也因人肤色、性别等身份属性的不同存在差异。目前常用的深度学习方法能够有效地提取图像语义特征完成表情识别,但由于现有的表情数据集样本偏少,仍难以学习到与个人身份无关的表情特征。本文研究了基于情感特征解耦学习的表情识别方法以解决表情特征与身份特
大数据时代,数据以维数高、知识体系混杂、数据量大等特点呈现,给基于数据的研究带来巨大的挑战。维数约减是从高维数据中抽取知识、形成组织、发现内在规律,进而减小冗余、增强特征价值密度、提高后续计算效率的有效方法。非负矩阵分解(Non-negative matrix factorization,NMF)作为非线性且带有非负约束的矩阵分解降维方法,具有可解释性、计算简便、大规模处理数据等优点,因此广泛应用
目标跟踪是计算机视觉领域中的一个重要研究方向,已广泛应用在城市视频监控、城市智能交通、移动机器人目标跟踪、无人机飞行、虚拟现实和医学检测等多个研究领域。在实际应用中,常常出现目标遮挡、运动模糊、背景与目标相似、背景杂乱等情况,这些情况对跟踪算法的性能提出了很大的挑战。基于判别式分类器的目标跟踪算法因其效率高、效果佳的优势逐渐成为目标跟踪领域的主流研究方向,基于此,本文对基于判别式分类器的目标跟踪算