论文部分内容阅读
在计算机视觉领域中,如人脸识别、视频检索等,所获得的数据往往具有较高的维数。寻找数据的低维表示即维数约简是计算机视觉研究领域中的一个核心问题。最近几年,受生物模型启发,缓变特征分析越来越受到研究者的关注。缓变特征分析从快变的时序信号中学习缓变成分。本文以缓变特征分析为工具,提出了一系列的无监督和有监督的维数约简方法,并将所提出的方法成功应用于人脸识别。 论文的主要工作归纳如下: (1)提出自适应无监督缓变鉴别分析(Adaptive Unsupervised Slow Feature Discriminant Analysis,AUSFDA)算法。传统的缓变特征分析无法直接应用于无明显时序结构的数据集,若采用近邻算法选择时间序列对,则存在近邻超参数难以选择的问题。基于此进一步假设能够构成一个时间序列的两个点来自于同一个光滑流形,通过数学上推导,重新给出了缓变时间序列的定义。从缓变时间序列的定义得知能构成时间序列的两样本点同时满足两个性质:(a)在欧氏空间中离得比较近;(b)在子流形上具有相似的切方向。通过缓变时间序列集计算缓变散度矩阵。另外,为了使学习的低维特征有助于随后的分类任务,将不能组建成缓变时间序列的点对(point-pair)定义为快变时间序列用于计算快变散度矩阵。AUSFDA寻找一组投影向量能同时使缓变散度最小化和快变散度最大化。 (2)提出自适应监督缓变鉴别分析(Adaptive Slow Feature Discriminant Analysis,ASFDA)算法。基于类标签信息,此方法利用缓变时间序列定义和异类近邻信息分别构建类内缓变时间序列和类间快变时间序列,进而计算类内缓变散度矩阵和类间快变散度矩阵。然而,由于数据分布的多样性和复杂性的原因,最小化类内缓变散度最优向量集与最大化类间快变散度的最优向量集之间通常会存在冲突。ASFDA采用差值形式的鉴别分析模型,以最大化鉴别能量函数,采用迭代的方式学习平衡参数,用于缓和上述的冲突。 (3)提出基于全局结构保持的统计不相关的缓变鉴别分析(Uncorrelated Slow Feature Discriminant Analysis via Globality Preserving,USFDA-GP)算法。缓变鉴别分析本质上是一种基于局部几何结构的维数约简算法,它忽略了全局几何结构信息。实验表明,全局结构有助于提高特征的分类性能。在详细分析了全局结构的LDA算法存在的不足之处的基础上,将两种全局结构信息融合到缓变特征分析的框架中。另外,消除特征之间的冗余性能够大大提高特征的分类性能。然而,传统的学习统计不相关鉴别特征是通过一种耗时的迭代方式。通过一系列的数学变换,最终的模型可以直接通过求解标准特征方程来获取统计不相关投影鉴别向量。 (4)提出两种基于L2,1范数最小化的二维缓变鉴别分析算法,即单边投影算法(Two-dimensional Slow Feature Discriminant Analysis via L2,1Norm Minization,2DSFDA-L2,1)和双边投影算法(Bilateral Slow Feature Discriminant Analysis via L2,1Norm Minization,BSFDA-L2,1)。在人脸识别问题中,直接利用图像矩阵构造散度矩阵的维数约简方法既能有效减少存储空间,又可以保持图像本身的空间信息。首先,将传统的缓变鉴别分析推广到基于矩阵图像的二维的形式;接着分析二维特征的统计不相关性,并给出基于行统计不相关性和列统计不相关的数学模型;再次通过引入最小化L2,1范数的约束,获取具有行稀疏性质投影矩阵。这样不仅避免了基于向量稀疏会破坏数据的整体结构信息的问题,而且能够选择有利于最终分类的特征。最后,针对单边投影的二维算法会带来更多的表示系数的问题,我们将2DSFA算法拓展到双线性模型的形式。