基于分类导向的三维联合头部姿态估计与人脸关键点定位

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:stonefountain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网开启了数字化的时代,利用机器学习和深度学习的方法提取大量数据信息中的高层知识进行学习以完成人机交互成为一大研究热点。人机交互的关键首先在于根据不同的交互需求识别人体的特定部位的特征,生物识别作为一种快捷、友好的身份识别特征应运而生。现有的较为成熟的生物识别技术包括虹膜识别,指纹识别,语音识别,步态识别以及人脸识别等,其中人脸作为一种重要的生物识别特征,由于其具有提取便利以及非侵犯性的特点,更能够被受试者所接受,也因此促使该领域的研究不断成熟。研究人体的头部姿态,以及眼角、鼻尖、嘴巴、下巴等人脸关键点是人脸分析领域的关键性问题,这两个问题已经能够在图片上获得不错的结果,但是基于图片的方法大都对光照的敏感性较强,且不能很好的处理具有大角度头部偏转的人脸以及遮挡的情况。由于三维扫描仪器制造成本的不断降低,扫描数据精度的逐步提升,以及深度数据自身包含的丰富几何信息这一特点,使得越来越多的研究者将深度信息应用于人脸分析领域。头部姿态估计与人脸关键点定位常被分为两个问题独立研究,但是头部姿态估计的结果可以为脸部关键点定位提供很好的空间变换信息,同时脸部关键点的结构又可以反映头部姿态向量的数值,因此如何将两者结合起来优化是本文的一个核心问题。本文提出了一种基于分类导向的3D联合头部姿态估计与人脸关键点定位方法。首先,分类导向是指将头部姿态空间分为若干个类,在各类中分别执行脸部关键点定位算法。这样做可以保证在同一姿态空间下,头部点云数据缺失部位相对一致,对关键点定位算法稳定性的提升大有帮助。其次,本文提出了联合的概念,在级联的随机森林回归框架下,将头部姿态估计的结果与标记有关键点的人脸模板相结合,为级联回归的初始化阶段提供一个很好的初值,且级联过程中每一阶段的关键点定位结果又可以反过来优化头部姿态向量。最后,本文给出了一个三维人脸数据库,它包含了不同身份、不同表情以及不同的头部姿态数据,且给定了头部姿态向量与人脸关键点形状向量的真实值。丰富的实验展示了本方法的有效性和高效性。本文中的方法在BIWI以及B3D(AC)2两个常用的三维数据库上均取得了较现有的方法更为精确的结果。另外,本文的方法也适用于其他涉及姿态估计和关键点定位领域,具有一定的泛化能力。
其他文献
本文讨论了模糊Choquet积分及三种推广形式的模糊Choquet积分的基本性质,主要包括以下内容:   1.讨论了若干模糊Choquet积分有别于Choquet积分的性质,证明了模糊Choquet积
对于图灵斑图的数学机制描述,通常是指常微系统的稳定常数平衡态在加入扩散后发生稳定性反转,在其附近会产生图灵斑图.然后用某类模型实现这一过程,得出产生图灵斑图所需的参数条
电容层析成像(ECT)是一种可获取封闭区域内介质分布图像的过程成像技术,它具有非侵入性、适用范围广、价格低廉等优点,因此在多种工业生产过程中得到广泛运用。传统的确定性
非线性动力系统中,混沌现象广泛存在,如何控制和利用混沌是当前科学研究的热门课题。混沌控制有两种要实现的目标,即抑制系统的混沌和使系统产生混沌的行为。目前,混沌控制的方法
物探行业是一个高危、高风险的行业,技术的不断创新、人员队伍的不断壮大,周边环境及全天候的施工给作业现场带来了很大的风险,HSE现场监督如何把握和控制作业风险,成为了在工作
简化复杂的网格模型,减少模型的数据量,对于数字几何处理技术的各个研究领域技术的发展以及推广都有非常重要的意义,尤其是模型的实时渲染和传输。由于科技的发展,可视化技术
本论文主要研究的是拓扑图论里的一个重要问题,即图在曲面上的嵌入。  本文研究的嵌入是胞腔嵌入,所关注的曲面是不可定向的小亏格曲面,包括射影平面,Klein瓶和可定向曲面.图的
新中国开国之初,华东军政委员会主席是饶漱石。时为中共中央华东局第一书记、华东军区政委的饶漱石,论级别,当然是有资格充任此职的。然而,按当时的惯例,各大行政区军政委员
定性资料统计分析是统计分析的重要内容之一,它广泛应用于社会科学、生物医学、社会心理学、市场经济、教育和农业等许多领域.定性资料统计分析以多元统计分析的理论为基础,采
高性能计算已广泛应用于国民经济、航空航天、生物信息安全处理等领域,在国民经济和社会生活中发挥着日益重要的作用。然而当前高性能计算面临两个重大问题:第一,摩尔定律所阐述