基于生成对抗网络的偏转人脸转正研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:niuyq888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别技术是近几十年来飞速发展的领域,得到了广泛的关注。随着深度学习的不断发展,对人脸识别的研究取得了许多突破性的进展。基于深度学习的识别算法甚至超过了人类肉眼的水平,然而这些研究大多是在正面人脸或者近似正面人脸的前提下,因此这些研究都存在着一定的局限性。本文为了解决多姿态人脸识别,从生成正面人脸的角度出发,深入研究了现有基于生成对抗网络的偏转人脸转正算法,并在此基础上提出了两种人脸转正方法。本文主要的研究工作如下:1)提出了一种基于边界均衡生成对抗网络(Boundary Equilibrium Generative Adversarial Network,BEGAN)的双通道偏转人脸转正算法。为了解决传统生成对抗网络由于不合理的距离度量导致的训练困难、模式崩溃等问题,进一步提高人脸转正的效果,首先,借鉴BEGAN的网络结构设计思想,将判别器设计成自编码器,并将判别概率值改成连续的能量值,能够使得训练过程更加稳定高效,提高生成样本的多样性;其次,添加Light-CNN特征提取模块作为生成对抗网络中的第三个结构,同判别器一同与生成器进行对抗,保证生成前后的身份一致性;最后,与其他算法相比,采用了较为简洁高效的网络结构,避免了对人脸进行多尺度的特征提取,大大减轻了计算负担。在多种数据集上进行的定性和定量对比实验证明了该算法对网络结构的改进是有效的;2)提出了一种基于姿态先验的多角度人脸转正算法(Pose-aided Generative Adversarial Network,PA-GAN)。在生成对抗网络中加入偏转人脸的姿态先验参数,能够在增加约束条件的同时加速网络的收敛。首先,提出了一种基于随机回归森林的RGBD图像头部姿态估计算法,能够得到准确率更高的姿态估计结果;其次,将双通道网络结构修改为单通道结构,这是因为双通道网络结构为了得到人脸细节区域对偏转人脸进行了特征点定位,这限制了双通道网络结构能够应用的姿态变化范围;最后,采用了BEGAN的思路来设计网络结构,避免了深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Network,DCGAN)等网络结构带来的诸多问题。在公共数据集上展开的多重实验结果表明,该算法能够对姿态变化范围更广的偏转人脸进行有效转正;3)构建了一个姿态鲁棒的人脸识别系统。该系统实现了实时入库、人脸检测与定位、人脸特征点提取、人脸转正、人脸识别等功能,具有良好的交互性,能够实时展示人脸识别结果,该系统的搭建对基于人脸转正的多姿态人脸识别方法有着重要意义。
其他文献
碳纳米管因具有高长径比、高机械强度以及良好的物理化学稳定性等特点而被广泛研究。在真空电子学的研究中,基于碳纳米管的冷阴极技术正不断发展,在具有快速启动、结构紧凑等特点的基础上已逐步实现了大电流密度、高稳定性的电流输出,并逐步被应用在基于冷阴极技术的X射线管、电离真空计等器件的研究当中。但是要使碳纳米管阴极实现在以行波管为代表的微波功率器件上的应用,由于对电子注层流特性要求较高,还需要结合冷阴极的特
颗粒体系是由大量粗颗粒堆积形成,是复杂的多体相互作用体系,呈现出颗粒尺度的结构不均匀和动力学不均匀性的基本特征。颗粒体系的基本特征决定了从基本理论到实验手段上,表征与建立颗粒材料结构与性能的相关性都极其困难。现有测试分析手段所描述的颗粒系统组织结构过于简单化,缺乏对颗粒结构和动力学的真正认识,从而制约了颗粒体系研究的发展。因此,开展颗粒体系结构和动力学性质的测量,是理解和认识颗粒体系重要物理和力学
孤子和异常波的新颖动力学研究是非线性科学领域中的前沿课题之一。孤子概念的提出最早可追溯至1834年,其年苏格兰人罗素在爱丁堡附近的运河中首次观察到了波形稳定的水波孤子。其后,特别在20世纪60年代以后,由于激光器的出现、新材料制造技术的成熟以及超快诊断技术的不断涌现,光孤子科学得到了迅猛的发展,并迅速应用于实践中,如远程光纤通信、光存储和全光开关等。广义上讲,异常波(rogue wave)可认为是
光学层析成像是一种典型的非侵入式医学成像技术,其基本原理是,用近红外光照射生物组织,使光子在生物组织内被散射和吸收,用高精度仪器测量组织体表面的光强分布信息,再采用稳定的重构算法重建生物组织的光学参数,光学参数的高对比度表明生物组织体内存在某些异常信息。光学层析成像的数学模型通常为偏微分方程初边值问题,根据空间尺度的不同,常用的偏微分方程模型包括Maxwell方程组、辐射输运方程和扩散方程等。本文
两相流动中的散粒体系统颗粒破碎研究是当前许多领域关心的问题,该问题对于发射装药发射安全性研究具有重大意义。发射药床的挤压破碎是评定发射装药发射安全性的核心问题,对此的一般性研究是单独采用离散元法模拟颗粒、散粒体系统及内部颗粒的破碎,以动态挤压模型代替实际工程中的燃气推动作用,未考虑流体作用的复杂过程,本文的创新性在于还原实际工程中的气体冲击荷载,将复杂的气固相互作用考虑到发射药床的运动研究中。本文
在量子通信中,一般使用量子态作为信息的载体,即用量子态来编码信息。要有效地实现量子通信,就必须能准确的从所传递的量子态中提取编码的信息,也就是能很好的识别携带信息的量子态。而量子态在经过信道传输后,由于信道噪声的影响,原本正交的两个量子态会变非正交乃至近乎重叠的态。所以如何高效可靠的识别非正交的量子态,是量子通信中必须解决的问题。量子态识别的效率和可靠性直接决定了量子通信的质量。而应用量子信息、实
热传导过程中的反问题在工业领域中有很多重要的应用。例如窑炉、传热设备以及高温高压设备(如氨合成塔及大型乙烯装置中的废热锅炉等)中,由于涉及到高温高压的恶劣环境,一些物理参数比如热传导过程中的内部源项,热传导率,热传导过程的初始温度等无法直接测量。人们通常可以利用其他可测量的温度场相关数据通过数学上的反演方法得到这些未知参数,进而获得热传导方程的解,由此描述热传导过程。这类问题是典型的热传导方程参数
Drazin逆是一类非常重要的经典广义逆,在复矩阵,Banach代数,C*-代数等领域已经取得了相对完整的结果.Clean环研究起源于模的消去性问题,而在研究模的消去性问题中最重要的问题之一是研究环的exchange性,这方面的研究成果非常丰富.Clean环与Drazin逆有紧密的联系,在Drazin逆和clean环的研究过程中,吴藏和赵良引入了中心Drazin逆,中心群逆以及中心clean元的概
本文主要研究有限维半单拟三角Hopf代数上的广义Frobenius-Schur指标,我们定义了有限维半单拟三角Hopf代数上的一类广义Frobenius-Schur指标,并通过研究这类指标的某些算术条件及性质来间接获取相关拟三角Hopf代数的结构信息.本文主要分为以下四个部分:首先给出有限维半单拟三角Hopf代数上的广义Frobenius-Schur指标初始定义并根据定义计算了 4阶以下循环群代数
加权异构信息网络(Weighted Heterogeneous Information Networks,WHIN)是图模型的扩展,具有异构性、语义丰富性和关联性,有更好的语义表达能力,被越来越多地用做数据表示模型。大数据时代下,相似性查询处理技术得到广泛应用,是目前数据管理技术的研究重点之一。图编辑距离(Graph Edit Distance,GED)最常用于度量图模型的相似度。然而,GED仅能