论文部分内容阅读
人脸检测是人脸分析的首要阶段,目的是确认输入图像中是否存在人脸,若存在则输出人脸位置、大小等信息。在实际应用中,人脸在不可控情况下的成像可能会受到各种因素的影响,例如:遮挡较大、光照不均、姿态表情不一、像素低等,再加上背景的复杂性,这些都会对人脸检测的精度和速度带来较高的挑战,也使得人脸检测一直是机器视觉中的主要研究课题之一。 在2001年,Viola和Jones曾提出了一个经典的解决方案,使得在低计算复杂度下快速实时的检测正面人脸成为了可能,因此该框架后来依然被持续改进和大规模使用,但该类方法大多依赖经验积累,训练成本较大。随着卷积神经网络应用的深入,图像特征的表达能力得到提升,基于该网络的算法普遍可以取得较好的检测结果。本文主要基于经典算法中的级联设计思想,提出判别投影Haar-like特征,采用改进的级联结构训练Adaboost人脸分类器;同时基于级联结构的人脸检测算法,提出了一种卷积神经网络,在公开人脸数据集上对比了算法效果,具有一定性能优势。论文主要工作如下: (1)总结目前人脸检测的发展现状,分析了现阶段人脸检测所面临的挑战,阐述了相关问题的解决方案,介绍了常用的人脸检测数据库,对生成候选框质量、重叠面积、召回率和精确率等评估指标进行了详细解释。 (2)从人脸检测系统设计的两个重要组成部分着手,详细研究并实现了几种经典的人脸特征提取和分类器框架。基于人脸的聚合通道特征,利用Fisher判别分析提出一种判别投影Haar-like特征,对图像的通道特征进行拓展,采用改进的级联结构Soft Cascade训练Adaboost分类器。训练过程中,利用通道特征空间中的人脸结构信息对正负样本分类训练,增强人脸特征的判别能力,在FDDB上与其他方法进行了结果对比,提高了原来的检测率。 (3)对基于卷积神经网络的人脸检测经典框架进行了详细研究,设计了一个卷积神经网络结构。该结构共分为两个阶段,第一个阶段利用低像素的候选窗口输入浅层卷积神经网络,快速排除大量背景窗口;第二个阶段将通过第一阶段的候选窗口,调整成两个较高像素的图像分别对应输入两个卷积神经网络分支,目标输出是否为人脸的概率和边界框回归向量。训练过程中,针对困难样本,进行在线训练,采用软-非极大值抑制算法对数据集进行多尺度测试,在PASCAL FACE和FDDB两个人脸数据集上与其他方法进行结果对比,具有较好的检测效果。