论文部分内容阅读
在人脸识别领域中,人脸检测是其中的一个重要环节,2001年Viola和Jones发明了 VJ人脸检测算法,该算法的诞生使人脸检测能够得到实际应用,但对于人脸多角度、多光照、多姿态等问题,VJ人脸检测器表现不佳。DPM算法的引入较好解决了复杂情况下的人脸检测问题,但是该算法存在计算量大,前期人工标记成本大等问题。神经网络特别是卷积神经网络的发展和GPU编程的实现给图像处理、音频处理、视频处理等领域注入了新的活力。卷积神经网络(CNN)在人脸检测领域有着无可比拟的优点,比如自学习特征、较好适应复杂情况下人脸、节省人力成本等。CNN用于人脸检测效果良好,但也存在着解释性较差的缺点。虽然人脸检测算法取得了巨大的进步,但是其中的很多工作并没有非常完美地解决,依然存在着巨大的挑战,如图像质量问题、人脸遮挡、多姿态、多表情、多光照、实时检测等问题,这些问题亟需解决。目前,通常采用传统方法和深度学习方法结合来解决人脸检测的问题。本文设计了一种基于级联卷积神经网络的人脸检测算法,级联结构策略权衡了算法准确度和运行时间,在保证较高准确度的情况下,运行时间尽量短。算法通过第一阶段的全卷积神经网络(FCN)提取人脸候选区域,比Selective Search、Edge Box等算法更高效。在第二、第三阶段特征学习能力更强的网络中,结合边框回归、NMS等算法进一步筛选人脸候选框,校准人脸框位置,最终输出头像中是否含有人脸,如果有,则输出人脸位置。为了提高人脸框的准确度和增强算法辨别人脸的能力,本文在训练方法上进行改良,优化了训练数据集,并设计了多任务学习网络。实验表明,该算法在FDDB上的人脸检测上准确度较高,检测时间较短。