基于单目视频序列的非刚性动态目标三维重建算法研究

来源 :中国科学院大学 | 被引量 : 5次 | 上传用户:acecar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于单目视频序列的非刚性动态目标三维重建是指从摄像机获取的二维投影图像序列中恢复出目标物体在每一帧的三维表面结构,从而获得随时间变化的目标的动态模型。非刚性动态目标三维重建是计算机视觉的研究热点和重要内容,具有重要的理论意义和应用价值。针对静态刚性目标的三维重建算法目前已发展成熟,并建立起一套较完整的算法体系,而非刚性动态目标的重建在近几年成为研究热点和待解决的关键问题。对于机器人系统或增强现实系统,对环境中的非刚性动态目标的三维重建是场景目标感知与理解的基础和关键技术,也是人机交互,虚拟与现实交互的必要前提。同时,动态目标三维重建也为虚拟内容的产生提供了方便快捷的方法。因此,这项技术在国防军事,机械制造,医疗,教育,通信,娱乐等产业中具有重要的应用价值。动态目标三维重建算法有很多分类,如基于标记点的方法,双目重建方法,多视角立体重建方法,多传感器方法等。由于传感器设备的限制,环境的多样,单目重建系统具有便捷和应用范围广的特点,对于某些只有普通照相机作为传感器的小型设备以及某些仅有视觉信号有效的场景尤为重要。然而目前大多基于单目传感器的非刚性动态目标稠密重建系统运行速率十分缓慢,远远达不到实时的标准。还有一些单目重建方案是非在线系统,所有的视频序列帧需要在获取之后同时处理。效率问题和非在线问题阻碍了单目动态稠密重建系统的性能和应用。目前高速率的单目动态目标稠密重建系统仍然是一个有待解决的问题。虽然有一些实时的单目重建系统出现,但均为稀疏系统,只追踪了少量关键点,并没有生成稠密的物体表面三维模型。故本文围绕基于单目视频序列的非刚性动态目标三维重建算法这一课题展开了研究工作,对其中的关键问题进行了深入探讨,在优化算法重建效果,提高计算效率,增强算法鲁棒性,拓宽重建方法的使用范围,解决非在线问题等方面做了研究。本文的主要研究工作与研究成果如下:1.搭建了一个基于模板的单目相机视频序列动态目标三维稠密重建系统,采用能量最小化的方法,求得目标物体时变的三维模型。基于单目传感器的重建系统结构简单,成本低廉,操作便捷。基于模板的重建方案提供了一种序列式的帧到帧在线重建方法,具有达到实时性能的可能性;且在处理基于点的系统,多尺度,遮挡以及模糊的情况下具有优势。采用了基于Iterative Schur(IS)的线性算子,IS算子结合了预条件共轭梯度算法和类似Schur complement trick方法,使得求解达到了更快的收敛,提高了重建效率。采用真实图像序列进行了实验,包括在遮挡情况下的重建,从实验重建效果和效率方面验证了本系统的可行性。2.构建了一种简单可控的基于单目视频序列的三维模板生成方法,该方法作为动态目标三维重建算法的预处理阶段,可实现多种复杂物体的模板构建,如人脸,人手等,拓宽了重建方法的使用范围。这一阶段需要刚性移动的目标物体的视频序列或从不同角度拍摄的目标图像集作为输入。首先,利用VisualSFM的标准刚体SFM(structure from motion)方法,得到序列帧的摄像机外部参数以及稀疏特征点重建数据,该算法有较高的准确性和鲁棒性。然后,通过多视角立体算法(Multi-View Stereo)为每帧输入图像计算密集的深度图。过高分辨率的深度重建不仅会大大增加处理的时间,同时也会产生更多噪点,故通过参数控制深度图的分辨率。最后,融合各帧深度数据形成点云,采用浮动尺度表面重建(floating scale surface reconstruction)算法重建一个表面网格模板。优化匹配的深度重建方法以及浮动尺度的表面重建方法,提高了算法在较强环境变化,不受控图像采集和数据冗余情况下的鲁棒性,使模板构建结果尽可能地保持一定的准确性。3.在AR系统中搭建了单目视频序列动态目标三维重建系统,实现了动态目标的三维重建和在虚拟环境中的虚拟动态对象生成与渲染。Hololens是当前应用最广泛,发展也最成熟的AR设备,它具有粗略地重建周围静态场景的功能,目前还不支持动态对象的重建和跟踪。此外,Hololens不向开发人员提供直接访问原始深度传感器数据的权限,而只提供粗糙的3D重建网格的接口。为了完成对环境中动态物体的重建,利用本文的单目动态目标重建方法对Hololens相机视频流数据进行处理是一个可行的解决方案。在应用到AR系统中时,平衡了效率与重建规模,规避了金字塔模型的冗余,采用网络通信将重建系统与AR系统进行分离,以提高运行效率。进行了相应实验,证明了该系统的可行性。
其他文献
随着网络技术的飞速发展和多媒体技术的广泛应用,越来越多的人使用网络上传多媒体信息,多媒体信息与日剧增。由于视频数据自身内容的特点即丰富性、多样性、结构的复杂性以及具
随着分布式软件在电信、金融等领域的广泛应用,人们对其可用性、可靠性和安全性等可信性质给予了更高的期望和要求。为解决日益突出的分布式软件可信性问题,需对其交互行为实
无线传感器网络技术已经融入到了人民生活、生产的很多领域,它被列为21世纪最有影响的21项技术和改变世界的10大技术之一,而无线传感器网络的节点是整个传感器网络的支撑平台和
本文介绍了四种卫星导航系统:GPS、GLONASS、Galileo以及北斗,通过对几类基于四种卫星导航系统的单模、多模终端设备的分析,以及针对导弹武器系统对高可靠性授时定位设备的要求,
随着蔬菜现代化产业的快速发展,蔬菜设施栽培面积不断扩大,设施栽培面临的最大问题是连作障碍导致的土传病害等。嫁接是解决连作障碍最有效的一种可持续性生物栽培方法。目前我
车牌识别是智能交通和治安管理等各种应用中重要的组成部分,鲁棒、高效、灵活的车牌识别系统具有广泛的应用和巨大的经济价值。由于实际应用中车牌图像的多变性,车牌识别仍未
手写体字符识别是模式识别和图像处理中一个非常重要和活跃的研究领域,在信息处理领域中使用字符识别技术可以大大提高计算机的使用效率,字符自动识别是办公室自动化、新闻出版
水果机械损伤是收获机械化的主要问题,是采摘机器人系统设计与应用所面临的重大难题。至今,国内外对于水果损伤的研究主要侧重于各种受载、损伤力学与数学模型的研究,且以定性讨
奶牛生理状态监控系统是实现现代化奶牛养殖的重要工具,对提高养殖场产量,保证产品安全起着重要的作用。奶牛行为识别技术是奶牛生理状态监控系统得以实现的基础。有效地提高奶
随着互联网的发展,一种分布式架构的网络:P2P(Peer to Peer)网络成为流行的网络结构。P2P网络具有高度的动态性、自治性和异构性。用户参与网络的随机性,自愿性及用户不同的计算