基于局部特征提取和卷积神经网络融合的真实条件人脸识别算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:l77500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是一种非常有效的生物特征识别技术,近年来逐渐引起了各界的关注。但是真实条件下,人脸图像在采集过程中极易受到各种环境因素的干扰,导致个体图像的类内差远大于类间差。因此,如何从采集到的人脸图像中提取出一个与环境无关高鲁棒性的人脸特征是人脸识别领域的重要关注点。人脸局部特征提取和卷积神经网络是人脸识别课题研究历程中的两个重要阶段,虽然后者在近几年逐渐在人脸识别领域占有主导地位,但不可否认的是,真实条件下某些传统的局部特征提取方式依然能够有效地解决人脸识别中的很多问题。本文着重研究了真实条件下的人脸识别问题,将局部特征提取技术融合到了卷积神经网络的框架中,提高真实条件下卷积神经网络所提取人脸特征的鲁棒性,主要研究工作和创新点集中在以下几点:  1)提出了一种基于泰勒展开的人脸特征提取算法,首次将泰勒展开应用到了人脸特征提取算法的研究上。具体的做法是,在LBP算法的基础上,结合泰勒展开定理将人脸图像中的像素点由原来的灰度域转换到了泰勒特征域,通过提取面部图像不同阶数的泰勒特征,去近似人脸特征,得到Taylor Feature Face(TFface)特征图。相比于传统的LBP算法,TFface考虑了窗口中心像素点与其邻域像素点的高阶导数特征信息,因此能够更深刻描述像素点同周围像素点之间的关系,获得更多的人脸结构信息,提高特征对于姿态、表情环境因素的鲁棒性。  2)光照是影响人脸特征提取算法稳定性的一个非常重要的干扰因素。针对人脸图像采集过程中光照变化的影响,提出了一种基于拉普拉斯对数脸(Laplace Logarithm Face,LL-face)的光照不变量人脸特征提取算法。文中首先将人脸图像转换到拉普拉斯对数域,并在该图像域中提取人脸的LBP特征,得到LL-face,并给出了LL-face人脸特征提取算法与光照变化无关的证明。在两个典型的专门关注光照问题的数据集Yale B和CMU PIE上的实验结果表明,LL-face特征对于光照不敏感,即使在光照变化很极端的情况下依旧能够描绘人脸轮廓的关键边缘信息,提取人脸的本质特征。  3)近年来,卷积神经网络逐渐成为一种特征提取的有效手段,能够实时地从面部图像中提取个体的本质特征,在人脸识别、目标追踪、表情分析等领域都得到了极大地重视。实际中,卷积神经网络易于受到噪声干扰,对图像添加一定强度的噪声后,网络的性能会急剧下降,严重影响所提取特征的稳定性。针对噪声干扰问题,本文设计了一种基于鲁棒LBP指导的池化层(G-RLBP池化层),该池化层聚焦特征图中的每个特征点,对该特征点是否受到噪声干扰给出判断,并计算了特征点受干扰的概率,得到池化权重图,最后利用权重图对特征图进行池化。对比卷积神经网络中常用的池化层如最大值池化,G-RLBP池化层在对数据维数进行约减的同时可以降低图像中噪声对于特征图的干扰,提高特征的鲁棒性,在图像受到噪声严重干扰的情况下,G-RLBP池化层的优势更加明显。  4)考虑到GoogLeNet在计算机视觉中的成功应用和计算效率上的优势,本文对GoogLeNet进行了改进,搭建了一个融合局部特征的真实条件卷积神经网络-SimitFaceNet网络。与GoogLeNet相比,SimitFaceNet融合了一些人脸图像的局部特征,网络的结构特征主要体现在以下几点上:  Convl层的卷积核大小从7×7缩小为5×5。这样不仅减少了第一个卷积层的计算量,同时在网络的第一层使用更小的卷积核也有利于从人脸图像中提取更精细的结构特征。  用G-RLBP池化层替换网络中原有的Pool1最大值池化层,增强网络对于噪声的鲁棒性,这种池化方式在进行模型参数约减的同时可以提高模型的识别性能。  将彩色人脸图片分解为RGB三个通道,将RGB三个通道分别转换到相应的LL-face特征域,提取与光照无关的人脸特征,提高网络对于非可控环境中光照变化的鲁棒性,将此时的RGB三通道重新命名为LL-RGB。  提取人脸图像原图的人脸泰勒特征图TFface,将三通道RGB输入改为四通道输入:彩色人脸图像三通道LL-RGB+TFface。  网络训练过程中,根据loss曲线波动情况,动态调整dropout比率,恢复部分死亡神经元的活性。  大量实验结果表明,本文所搭建的深度卷积神经网络框架,能够有效地提升基于卷积神经网络所提取特征的鲁棒性,提高系统在真实条件下的识别精度,同时本文中所给出的网络架构也可以推广应用到其他的基于图像的模式识别场景中。
其他文献
本文通过对荣华二采区10
期刊
摘要:小学语文教学中的写作教学,面向的对象是一群天真活泼的小学生,他们生活经验不足,写作经验同样非常缺乏。而且他们的识字量、词汇量都远远不足。这些都成了小学作文教学开展的难点所在。小学语文教师在培养学生写作水平的时候,要遵循学生心理发展的规律,结合小学语文的自身特点进行科学的训练。  关键词:小学语文;写作教学;语文教学  现在很多小学生在学习写作时畏惧心理比较严重,因此在他们的作文中也表现出来各
该课题研究内容包括两方面:一是对频谱占有模型进行了研究.首先介绍了Laycock-Gott模型(长期频谱占有模型)和马尔可夫模型(短期频谱占有模型)的原理,分析了两类模型的联系,还
本文通过对荣华二采区10
期刊
甾醇14α-去甲基化酶(也称P45014DM,CYP51)是唯一的广泛存在于细菌、真菌、植物和动物中的细胞色素P450家族成员。它被视为最古老的细胞色素P450家族成员。它催化甾醇的14α-
他是名副其实的“西瓜先生”。他主持绘制完成了世界上第一张西瓜全基因组图谱,利用这张图先后培育出一系列抗病性强、口感好、糖度高的西瓜新品种。他所主持选育的“京欣”
脑部诱发电位在神经生理学和临床诊断和监测中具有重要意义,自发现以来就引起了医学界和心理生理学界的极大兴趣。从原始的粗糙脑电信号中准确快速的提取出微弱的诱发电位一直
伊拉克战争等现代战争的经济表明:各军种联合作战,是未来高技术条件下战争的主要模式.这种战争模式,客观上要求有一个良好的联合作战信息系统,以便不间断的给部队提供有效的
摘要:高中英语作为一门语言类学科,培养学生听、说、读、写的能力成为教学的基本目标。其中的读,是指的阅读,是四项基本目标中更加基础的,是学生获得更多的英语知识、提升自身的英语技能的有效途径,更是学生提高理解能力和对英语的综合运用能力的有效途径。但是在当前的高中英语阅读文本教学中还存在着很大的误区,导致学生在阅读理解过程中出现了解读不准确,甚至出现失误的现象。所以,重视高中英语阅读文本解读的误区,并采
近些年来,超声多普勒作为能够真实反映心血管系统血流动力学的主要工具在临床应用上做出了卓越的贡献.它已广泛应用于评价心脏及血管功能并且对于不同心血管疾病的诊断、治疗