论文部分内容阅读
人脸画像合成技术是指将一张人脸照片通过特定方法转换成一张人脸画像的技术。人脸画像合成算法被广泛应用于多个领域,在刑侦判案领域,犯罪嫌疑人的人脸照片往往不能直接得到,我们能够获得的有效信息是专业画师在目击证人描述下绘制的一幅模拟画像,由于人脸照片与人脸画像的产生机制、信息表达方式不同,我们难以直接将两者进行比对。在这种情况下,可以通过画像合成技术将公民数据库中的照片全部转化为画像,在相同模态下对画师绘制的画像与数据库照片生成的画像进行比较,从而锁定犯罪嫌疑人。在数字娱乐和移动互联网领域,人脸画像合成技术可以自动生成不同风格的人脸画像,用户将生成的画像作为社交账户头像,既可以在互联网交流中彰显个性,也为生活带来了乐趣。然而,在现实场景中,由于照片采集的光照条件多变,背景环境复杂,使得已有的画像合成方法在合成画像时往往包含很多的噪声和伪影,这极大地影响了合成画像的质量。同时,因为画像合成算法近邻搜索阶段需要大量的距离计算,使得合成一张人脸画像需要很长的时间。本文基于这两个问题对快速鲁棒的人脸画像合成方法展开研究,旨在提高画像合成的速度,增强不同环境条件下画像合成的鲁棒性。本文的主要工作内容和创新概括如下:1.实现了一种人脸画像合成鲁棒化的预处理方法。通常情况下,用于画像合成的训练集照片由专业设备在自然光照,背景单一的环境中采集得到,且均为正面姿态。而输入照片由于受环境因素的影响可能存在曝光、暗光、光照不均,侧脸姿态等问题,很难做到与训练集照片一致,这会导致画像合成近邻搜索阶段的误匹配,从而合成出错误的画像。本文采用了一种鲁棒化的预处理方法来解决该问题,对于输入照片,首先通过局部仿射变换将其校正为正面姿态,然后进行侧面光照和全局光照的处理,通过交互地对测试照片和训练集照片进行亮度重映射,使得两者具有相同的统计亮度值,合成画像后通过局部仿射变换将画像恢复成原来的姿态。该方法可以作为预处理步骤整合到现有的画像合成方法中,可以有效地提高画像合成的质量,同时基本不会增加额外的计算量。2.提出了一种基于快速近邻搜索的深度概率图人脸画像合成算法。传统的人脸画像合成算法以像素亮度为特征进行测试照片与训练照片的近邻匹配,这种方法忽略了人脸的结构信息,对光照变化和复杂背景并不鲁棒。本文提出了一种基于快速近邻搜索的深度概率图人脸画像合成算法,采用鲁棒化的预处理方法对测试照片和训练照片进行调整,采用深度卷积神经网络提取的深度特征代替像素亮度特征进行照片块的近邻匹配,采用深度概率图模型对画像重建权重和深度特征权重进行联合建模从而得到合成画像的最佳重构表示。深度特征具有比像素亮度特征更高的维度,因而带来了更复杂的距离计算,本文提出了一种快速近邻搜索方法来解决该问题。实验结果验证了本文所提算法的鲁棒性和快速性。3.提出了一种基于生成对抗网络的半监督人脸画像生成算法。基于模型驱动的画像合成算法通常因为缺少足够的数据而无法训练得到一个表示能力强的生成模型,使得合成的画像中包含较多的噪声。本文提出了一种基于生成对抗网络的半监督人脸画像生成算法来解决该问题。首先采用提出的人脸贴图算法将照片中的人脸无缝复制到艺术家风格的肖像画中,采用迭代式的局部风格迁移网络使贴图的人脸区域具有和肖像画相同的风格纹理,然后我们将贴图算法得到的人脸贴图和局部风格迁移方法生成的人脸画像作为数据对训练画像生成网络。在测试阶段,采用鲁棒化的预处理方法调整输入照片,通过贴图算法得到输入照片的人脸贴图,将人脸贴图输入生成网络,输出即可得到风格化的人脸画像。实验结果验证了所提算法的有效性。