论文部分内容阅读
视频监控在安防领域的作用日益显著,而目前对于视频内容的理解基本上还是依靠人工判断,所以如何高效地利用监控视频已经成为一个研究热点。虽然目前人脸检测和人脸识别技术在智能视频监控系统中如火如荼地部署,但是由于光照条件、各种姿态以及多尺度等多种问题的影响,人脸检测和识别技术在视频监控中的表现还无法达到预期要求。而深度学习由于其优异的特征表达能力受到广泛关注,本文针对视频监控中人脸检测和人脸识别遇到的具体问题,以深度学习为基础,进行了研究和算法改进。文章的主要贡献包括:(1)针对视频监控中的多尺度问题,以多尺度人脸检测具有代表性的S~3FD(Single Shot Scale-invariant Face Detector)算法为基础,结合FPN(Feature Pyramid Networks)目标检测算法的思想,从不同尺度特征融合的角度加强小尺度人脸的检测能力。通过数据增强采样和Max-out分类策略进一步提高了人脸检测模型对不同尺度人脸的检测能力。(2)为了使人脸检测算法满足视频监控中的实时性要求,针对S~3FD检测速度较慢的问题,对网络结构进行了改进和压缩来提高检测速度。C.ReLU激活函数的应用使得网络浅层卷积层可以以一半的卷积核完成所有运算;为了使人脸检测算法的速度进一步提升,文中通过压缩CNN网络所有卷积层的卷积核数量进一步减少运算量。(3)针对人脸识别中缺乏面向视频监控的数据集,通过网络与有关项目合作收集了一定数量亚洲人种数据和针对视频监控的数据,并利用基于3D模型的多姿态数据合成方法和改进的基于生成对抗网络(Generative Adversarial Networks,GAN)的人脸属性转换方法进行了数据集的扩充。(4)针对公开测试集上表现良好的人脸识别模型在视频监控场景下性能严重退化的问题,通过对人脸识别算法和迁移学习算法进行研究,改进了一种基于度量学习的Siamese Network算法来完成针对视频监控具体场景的人脸识别模型迁移。