论文部分内容阅读
随着人工智能时代的到来,以人脸图像为中心的计算机视觉得到了快速的发展。人脸关键点检测,又名人脸对齐,作为诸如人脸识别、表情识别等高级别视觉任务的基础技术,是多媒体领域研究的热点。由于人脸外观存在刚性与非刚性的复杂形变,传统人脸关键点检测算法常对挑战性场景较为敏感,比如人脸的大角度姿态变换,以及部分遮挡等。近年来,深度学习的发展给人脸关键点检测技术带来了曙光,因此本文的工作将以深度神经网络为主、以传统算法为辅,对人脸关键点检测问题作进一步的研究,本文的主要工作如下:(1)基于人脸区域规范化和可变形沙漏网络的二阶段人脸关键点检测。沙漏网络是用于人脸关键点检测的经典网络,但是其对大角度姿态变化较为敏感。为了提高沙漏网络对大角度姿态变化以及表情变化的鲁棒性,提出二阶段模型用于人脸关键点检测。首先,通过使用空间变换网络校正人脸,简化了传统上使用检测的关键点和人脸均值形状进行普氏分析,进而采用仿射变换来规范化人脸区域的方法。由此不同姿态变化的人脸图像都可以被变换成规范状态,实验证明有助于提升之后的人脸关键点检测的性能。其次,由可变形卷积网络得到启发,将可变形卷积与原始沙漏网络结合。可变形沙漏网络的特征提取能力得到提高,对人脸的非刚性形变更加鲁棒。在公开数据集300W和COFW上的实验结果证明了所提方法的有效性。(2)基于多阶段模型的人脸关键点检测。提出了一种同时对姿态和遮挡鲁棒的多阶段模型。该模型结合了空间变换网络、全卷积神经网络和人脸形状样本字典的优点。首先,由基于生成对抗网络理念设计的空间变换网络被用来解决人脸规范化问题,移除旋转和尺度变化,以获得对人脸关键点检测友好的人脸边界框。然后,使用全卷积神经网络对关键点作粗定位,同时对关键点的预测位置作置信度评分。最后,基于样本的形状字典被设计用来根据置信度较高的关键点改善置信度较低的关键点。在公开数据集的广泛实验表明所提出的多阶段模型可以显著改善遮挡下的人脸关键点,并且具有优于其他最新算法的性能。