论文部分内容阅读
人脸识别是一种非常有效的生物特征识别技术,近年来逐渐引起了各界的关注。但是真实条件下,人脸图像在采集过程中极易受到各种环境因素的干扰,导致个体图像的类内差远大于类间差。因此,如何从采集到的人脸图像中提取出一个与环境无关高鲁棒性的人脸特征是人脸识别领域的重要关注点。人脸局部特征提取和卷积神经网络是人脸识别课题研究历程中的两个重要阶段,虽然后者在近几年逐渐在人脸识别领域占有主导地位,但不可否认的是,真实条件下某些传统的局部特征提取方式依然能够有效地解决人脸识别中的很多问题。本文着重研究了真实条件下的人脸识别问题,将局部特征提取技术融合到了卷积神经网络的框架中,提高真实条件下卷积神经网络所提取人脸特征的鲁棒性,主要研究工作和创新点集中在以下几点: 1)提出了一种基于泰勒展开的人脸特征提取算法,首次将泰勒展开应用到了人脸特征提取算法的研究上。具体的做法是,在LBP算法的基础上,结合泰勒展开定理将人脸图像中的像素点由原来的灰度域转换到了泰勒特征域,通过提取面部图像不同阶数的泰勒特征,去近似人脸特征,得到Taylor Feature Face(TFface)特征图。相比于传统的LBP算法,TFface考虑了窗口中心像素点与其邻域像素点的高阶导数特征信息,因此能够更深刻描述像素点同周围像素点之间的关系,获得更多的人脸结构信息,提高特征对于姿态、表情环境因素的鲁棒性。 2)光照是影响人脸特征提取算法稳定性的一个非常重要的干扰因素。针对人脸图像采集过程中光照变化的影响,提出了一种基于拉普拉斯对数脸(Laplace Logarithm Face,LL-face)的光照不变量人脸特征提取算法。文中首先将人脸图像转换到拉普拉斯对数域,并在该图像域中提取人脸的LBP特征,得到LL-face,并给出了LL-face人脸特征提取算法与光照变化无关的证明。在两个典型的专门关注光照问题的数据集Yale B和CMU PIE上的实验结果表明,LL-face特征对于光照不敏感,即使在光照变化很极端的情况下依旧能够描绘人脸轮廓的关键边缘信息,提取人脸的本质特征。 3)近年来,卷积神经网络逐渐成为一种特征提取的有效手段,能够实时地从面部图像中提取个体的本质特征,在人脸识别、目标追踪、表情分析等领域都得到了极大地重视。实际中,卷积神经网络易于受到噪声干扰,对图像添加一定强度的噪声后,网络的性能会急剧下降,严重影响所提取特征的稳定性。针对噪声干扰问题,本文设计了一种基于鲁棒LBP指导的池化层(G-RLBP池化层),该池化层聚焦特征图中的每个特征点,对该特征点是否受到噪声干扰给出判断,并计算了特征点受干扰的概率,得到池化权重图,最后利用权重图对特征图进行池化。对比卷积神经网络中常用的池化层如最大值池化,G-RLBP池化层在对数据维数进行约减的同时可以降低图像中噪声对于特征图的干扰,提高特征的鲁棒性,在图像受到噪声严重干扰的情况下,G-RLBP池化层的优势更加明显。 4)考虑到GoogLeNet在计算机视觉中的成功应用和计算效率上的优势,本文对GoogLeNet进行了改进,搭建了一个融合局部特征的真实条件卷积神经网络-SimitFaceNet网络。与GoogLeNet相比,SimitFaceNet融合了一些人脸图像的局部特征,网络的结构特征主要体现在以下几点上: Convl层的卷积核大小从7×7缩小为5×5。这样不仅减少了第一个卷积层的计算量,同时在网络的第一层使用更小的卷积核也有利于从人脸图像中提取更精细的结构特征。 用G-RLBP池化层替换网络中原有的Pool1最大值池化层,增强网络对于噪声的鲁棒性,这种池化方式在进行模型参数约减的同时可以提高模型的识别性能。 将彩色人脸图片分解为RGB三个通道,将RGB三个通道分别转换到相应的LL-face特征域,提取与光照无关的人脸特征,提高网络对于非可控环境中光照变化的鲁棒性,将此时的RGB三通道重新命名为LL-RGB。 提取人脸图像原图的人脸泰勒特征图TFface,将三通道RGB输入改为四通道输入:彩色人脸图像三通道LL-RGB+TFface。 网络训练过程中,根据loss曲线波动情况,动态调整dropout比率,恢复部分死亡神经元的活性。 大量实验结果表明,本文所搭建的深度卷积神经网络框架,能够有效地提升基于卷积神经网络所提取特征的鲁棒性,提高系统在真实条件下的识别精度,同时本文中所给出的网络架构也可以推广应用到其他的基于图像的模式识别场景中。