论文部分内容阅读
在计算机视觉、模式识别、数据挖掘和机器学习等领域中,一个常用的模型假设是数据存在或近似存在于一个低维线性子空间中。如何利用这种低维性质进行维数约简、特征提取和噪声移除是近年来研究的热点问题。具体到矩阵形式的数据,矩阵秩的大小直接反映了这种低维性质。本论文即是研究如何将维数约简、特征提取和噪声移除等问题转化为秩极小化问题以及对应的求解算法。主要工作归纳如下: 首先,本文提出了两个基于核范数的二维主分量分析模型,即基于核范数的二维主分量分析和基于核范数的双边二维主分量分析。其基本思想是在重构误差准则中用核范数作为误差度量。文中证明核范数作为一种矩阵范数,比其它范数(如L2-范数和L1范数)更能准确地反映误差图像的结构,并且从概率分布的角度解释使用核范数刻画误差的合理性。针对提出的模型,提出了迭代重加权算法。迭代重加权的基本思想是把求解核范数优化问题转化为迭代的求解加权之后的L2优化问题。提出的模型在多个人脸数据库上进行了评估。实验结果证明了算法的有效性。 其次,本文提出了两个基于核范数的数据分解模型:基于双核范数的直推式矩阵分解模型和基于双核范数的归纳式矩阵分解模型。提出的模型用低秩假设同时刻画真实图像和噪声图像。即假设所有的图像向量组成的矩阵是低秩的,同时每一个(由于遮挡)引起的误差图像也都是低秩的。针对提出的模型提出了乘子交替迭代算法,新算法很好地利用了优化问题中变量的可分离性。在人脸图像的遮挡移除和背景建模等两个应用问题中的实验表明提出的两种模型可以在更好恢复低秩数据的同时,移除结构误差。 然后,本文提出了基于封顶核范数的矩阵补全模型。矩阵补全问题是从低秩矩阵的部分观测值恢复出未观测值。主流的解决思想是将这个问题转化为一个核范数优化。然而核范数的主要缺点是矩阵的奇异值被同等对待,导致在实际中核范数无法精确地逼近秩函数。为了解决这个缺点,提出了基于封顶核范数的矩阵补全模型。我们将揭示截断核范数与封顶核范数之间的内在联系。针对提出的模型,提出了DC(Difference of convex functions)求解算法,而且DC算法的收敛性可以从理论上得到保证。 最后,本文提出了四种基于低秩分解的子空间学习模型,即基于鲁棒主分量分析的无监督子空间学习和监督子空间学习、基于归纳式鲁棒主分量分析的无监督子空间学习和监督子空间学习。其主要思想是利用已有的低秩分解模型将图像分解为不同分量,然后在建模时对图像不同分量的作用分别考虑。通常的子空间学习模型,如主分量分析和线性鉴别分析,并没有考虑到图像不同分量的作用。例如图像的干净分量(主要分量)对分类有积极作用,而残差分量有消极作用。在多个基准数据库上的实验表明提出的方法优于多种其它方法。