论文部分内容阅读
随着人类认识、改造自然能力的不断增强,提取事物的特征并加以识别已成为人类最基本的活动。计算机的诞生和信息科学的发展,使得计算机视觉识别系统已经成为辅助或替代人类感知系统的重要工具,开始参与到人类的生活当中,让人们摆脱了部分重复性强、劳动强度大的繁重工作,并且取得了丰硕的成果。这些成果被广泛应用于工业、农业、国防、医学及天文等多个领域。仔细分析识别系统的组成就会发现,特征提取是分类识别的最重要的核心课题。面对纷繁复杂的事物和现象,为了去伪存真找出其本来面目,提取事物的几何不变量成为特征提取中的研究重点之一。利用几何不变量可以来辨别不同事物,也能够区分同一事物的不同情况下的形态。然而,几何不变量的相关研究仍面临着诸多挑战,比如在大量数据的情况下,如何设计出时间复杂度较低的计算几何不变量的算法,以及在复杂形变下如何构造出稳定的几何不变量等。本文以图像检索、三维重建、生物特征识别、视觉检测等应用需求为背景,围绕当前几何不变量研究存在的问题,在已有的数据资源和研究工作积累基础上,对快速的求解几何不变量算法和构造稳定的几何不变量算法做了深入研究,重点研究区分能力好、计算速度快、适用范围广、稳定实用的几何不变量特征提取算法,主要内容和贡献如下:①针对当前大规模二维点集的凸包求解存在计算时间长的问题,提出了一种基于仿射变换的二维凸包不变量求解算法。凸包是特征提取中的一个几何不变量。该算法综合考虑了常用二维分布的密度、质心位置以及宽度等属性,结合仿射变换的形变不变性质,通过模拟视觉注意力机制,对点集的几何形状分布进行初始估计,进而通过变换的方法使用凸多边形的内切圆去除大多数与凸包无关的点,从而提升算法执行的效率。并根据算法的特点,提出了两个与算法有关的定理,使用该定理可求解一个非约束优化问题,而无需借助耗时的迭代过程。实验数据结果表明,提出的算法能以较低的时间复杂度求解大规模二维点集的凸包。②针对现有的几何不变量构造方法在提取特征时,往往需要多次迭代或匹配,求解不变量容易造成误差增大和效率不高的问题,提出了一个基于区域面积比的几何不变量构造算法。首先对物体的二值化后的灰度图像求取其凸包,并计算其质心坐标位置;再利用质心和伪质心构成的直线,对灰度图像的区域应用划分策略;最终获得基于区域面积比的仿射不变量矢量表示形式。在哥伦比亚大学的fish数据集及Coil-100数据集上进行的实验表明,提出的算法得到的不变量特征满足仿射不变性,且不需要迭代计算不变量,有效地减少了累积误差对算法的影响。同时,物体图像受到一定范围内的干扰(被擦除、涂抹及遮挡)情况下,提取出的不变量特征具有良好的区分辨别能力。③针对海量人脸数据库进行检索时,大量的高维数据会严重影响检索的效率的问题,提出了利用人脸轮廓的几何不变量进行人脸粗分类的算法。该算法通过人脸轮廓的几何不变量特征,在预处理阶段,对人脸图像库建立多级层次索引结构,将具有相似轮廓特征的人脸划分到同一候选子类库中。该算法将为后续的细分类和匹配识别打下基础。在MUCT人脸数据库及PICS的Aberdeen正面人脸数据库上的实验表明,人脸轮廓特征可作为快速粗分类的依据,在预处理阶段能有效地进行人脸轮廓特征定位和脸型粗分类。④为了快速的提取三维凸包几何特征,满足三维空间下计算机仿真、大气建模等技术的发展需求,提出了一种基于椭球的三维凸包不变量求解算法。主要思想是在算法的初始步骤中,通过内切椭球代替四面体判别的方式,尽可能多的去除与凸包无关的三维点。在多元标准正态分布、均匀分布、指数分布、极值分布、对数分布和Johnson分布上的三维实验数据表明,提出的算法适用于海量三维数据凸包求取,在对多元标准正态分布下的一千万个点的集合求取三维凸包时,用时仅1.78秒,当三维点集的数据量增加时,提出的算法与Quickhull算法相比节省了更多的计算时间,表现得更有效率。