论文部分内容阅读
随着人工智能技术、模式识别技术、视觉导航技术和机器人技术不断发展,智能服务机器人将被大规模的投入人们的日常生活,并在各个行业中发挥至关重要的作用。服务机器人要想为人服务,首先应该具备自主运动和服务场景的理解及推理能力。因此,研究基于视觉和语义信息的多层语义地图,使机器人有能力刻画自己所处的场景、处理语义信息和自主导航具有重要的科学意义和应用前景。 与激光、声纳等传感器相比,视觉传感器具有体积小、精确、价格低、信息丰富等优点,因此,基于视觉的物体和场景识别、地图构建等问题引起了广泛关注,同时取得了丰富的研究成果。本文以单目视觉作为唯一的外部传感器,构建完全基于视觉的多层语义地图,模拟人的知识推理行为设置知识拓扑层、模拟人的场景划分能力设置场景拓扑层、以及模拟人的记忆行为构建地点拓扑层。主要研究内容包括: (1)多层语义地图的总体框架设计。首先,创建位于顶端的知识拓扑层,使多层语义地图具备知识表达和推理的能力。其次,为了使多层语义地图具备空间划分的能力,根据空间环境的场景信息,将工作空间划分为不同的区域,创建中层的场景拓扑层。最后,创建位于底端的地点拓扑层,使多层语义地图能为机器人的视觉导航提供所需的局部地点的信息。拓扑的每个节点保存在特定的地点拍摄的图像中提取的有用信息。 (2)基于分层词汇树和倒排索引的全局定位方法。分层词汇树能将图像压缩为几百个整形数(视觉单词),保留有价值的局部纹理信息,除去大量的冗余信息。倒排索引库将视觉单词作为属性值,图像的名称作为记录,提供有效的图像检索。为进一步降低定位错误,利用多层语义地图场景拓扑层的场景信息,构建基于场景划分的倒排索引库。实验结果表明,与构建整体的倒排索引库相比,根据场景划分的方法保证当前场景的查询结果不出现其它场景的图像,并减少检索的计算量。 (3)基于单目视觉的同时定位与地图构建系统(Monocular SLAM)。地点拓扑层需要存储视觉单词的3D位置信息,因此需要研究单目视觉的地图构建系统。本文采用基于局部Bundle Adjustment优化的方法既能保证系统的实时性,又可以得到较精确的结果。在图像帧之间的相对姿态估计方法上,我们提出了ORPE1算法(One Ransac camera Pose Estimation using13D point),实验表明ORPE1方法的估计精度高于Grunert的方法,同时单目视觉同时定位与地图构建系统实验表明,我们的系统能得到精确的相机姿态和3D位置信息。 (4)基于视差角模型的单目视觉地图构建系统。针对传统的局部BundleAdjustment方法消耗大量的计算时间,通过改进基于视差角的Bundle Adjustment(Parallax BA)算法提高Bundle Adjustment的优化速度。实验结果表明,基于视差角的单目视觉地图构建系统在处理速度上有极大提高。