基于双目视觉的三维重建

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:simsuns
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双目视觉是场景三维重建中的一种很重要的技术,它利用由相机所拍摄的两幅双目图像,依据相机的几何成像关系将物点的深度信息计算出来,进而计算出其三维坐标信息。该技术在计算机视觉、计算机图形学和虚拟现实等许多领域有广泛应用。本文对基于双目视觉的三维重建过程中的理论方法进行比较研究,实现了一个基于双目图片的三维重建系统。  课题中以针孔模型来描述相机,首先介绍了双目测距原理,这是双目视觉理论基础。众所周知,人眼可以感知三维信息,基于这一启发,人们通过研究发现,给定一组双目图片,通过三角测量方法,即可获得景物的三维坐标信息。  双目视觉基于视差原理对图像进行重构。其中最为关键的问题是进行双目立体匹配。双目立体匹配存在的主要问题是精度不高,这是因为大多数的匹配算法都是基于颜色特征的,如果不同深度的物点在双目图片中的颜色特征近似,就会造成比较大的误匹配。另外图像的模糊会造成颜色的失真;场景的遮挡现象导致对应匹配点在两幅图像中有时不能同时出现。这都增加了立体匹配的难度。如何充分利用图像信息提高匹配精度是图像匹配的难点。可以利用针孔模型中相关点的极线约束条件来减少匹配时的搜索空间。课题中首先实现了一种简单的基于极线约束的SSD匹配方法,它的主要思想在极线约束限定的搜索空间下寻找局部最优匹配点。通过实验,SSD匹配得到的视差图精度比较差,只能在纹理密集的部分如图像轮廓的边缘有较好的匹配结果。更为复杂的算法是基于图割(graphcut)的图像匹配算法,它将匹配的全局最优解看作是求解能量函数的最小值,通过适当网络,建立图网络中割的容量与能量函数的对应关系,把能量函数最小化问题转化为图的最小割问题,进而利用图的网络流算法实现优化。图割匹配算法是基于全局考量的,得到的解是一种近似全局最优解。基于图割的图像匹配算法计算量大、复杂度高,但是取得的匹配效果也更佳。  有了图像匹配得到的视差图和相机参数(焦距f、基线距离b),对于图片中的每一个像素点,可以根据三角测量原理计算出每一个像点对应的物点的Z轴坐标信息,进而计算出物点的三维坐标。然后对得到的实物云点进行三角划分,得到场景的几何造型,再由像点与物点的关系计算有纹理映射,实现纹理贴图,这样就得到了场景的三维模型。
其他文献
随着科技的不断发展,人们对互联网、网络资源已经不再陌生。而随着时间的推进,网络上的数据资源也日益增多,这些数目惊人的数据资源形成了很多在线数据库隐藏在深层网络中。
网络编码理论是网络通信领域研究的一项重要突破,可以提高网络带宽利用率、平衡负载和提高网络的鲁棒性。本文研究了网络编码的基础理论、线性网络编码的构造算法及其在P2P中
目前,分布式信息系统之间仍然存在一定的互联、互通、互操作的问题,对现有遗产系统进行系统集成是信息一体化建设的一种重要手段。Agent因其自治性、主动性和社会性等特点,本
图像信息已成为人们获取信息的重要途径,对图像信息的处理及利用变得极为重要。图像分割是图像处理领域、计算机视觉领域中的关键问题之一,是大多数图像分析及视觉系统的重要
疵病检测是精密光学元件质量检测的主要方面。本文在国家自然科学基金项目“强激光光学元件表面疵病检测技术研究”的资助下,对大口径光学元件表面疵病检测展开了研究。  
学位
超声医学图像以其快速、实时、安全和价格低廉等优点在各个领域都得到了广泛的应用。其中,超声成像技术作为一项新技术运用于黄牛繁殖和胚胎生产,是提高黄牛繁殖的有效手段,
中文事件抽取是中文信息抽取的一种重要方法,研究如何将从自然语言描述的非结构化文本中抽取出结构化知识,它涉及到自然语言处理、模式识别、机器学习、数据库等多个学科,在
本文以嵌入式数据库软件原型的研究开发为应用背景,采用面向对象方法、软件构架技术等软件方法论,以及XML和ACME等形式化描述工具,建立嵌入式数据库文件管理软件构架,并采用
随着网络技术的快速发展,网络安全问题逐渐成为人们关注的焦点。为了有效地保障网络的安全,人们提出了将入侵检测系统与具有安全特性的网络设备进行联动,来构建一个动态防御
本论文先介绍了数据仓库的相关理论、ETL(数据抽取、转换和装载)技术、OLAP(联机分析处理)与数据挖掘相关概念及其与数据仓库的关系。然后对利安公司现有数据进行分析整合,针