基于彩色和深度信息的头部姿势估计研究与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lxfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
头部姿势估计是一个典型而复杂的模式识别问题,在人脸识别、虹膜识别、视线估计等研究领域有着广泛的应用前景,具有重要的学术研究价值。本文以Kinect传感器获取的RGB-D图像为头部姿态估计的数据基础,以实时应用系统为目标,对头部姿势估计的各个模块(如图像预处理、特征提取等)展开研究,试图构建统一的深度图像姿态感知模型,来指导头部姿势估计特征设计,并寻找区分性好、鲁棒性强的特征以描述头部姿势的变化规律。具体来说,本文的主要工作和贡献如下:   ①针对Kinect传感器采集的RGB-D图像,融合深度图像和彩色图像的物理特性,设计了一种新颖的脸部定位分割算法。与传统多姿态人脸检测算法相比,该算法能精确、快速定位大姿态变化下人脸位置。   ②以人类视觉系统的深度信息处理能力为引导,提出了一个新颖的深度切片姿态感知模型。该模型采用“化整为零”的思想,将整幅深度图像分解成一系列切片,来描述目标的姿态变化规律,比较接近人类视觉系统对深度信息的处理过程,具有实现方式灵活多变、扩展性好和抗噪声能力强的特点。深度切片姿态感知模型为深度图像的表达提供了一个统一框架,为深度图像特征表达的设计提供了理论指导。   ③基于深度切片姿态感知模型,提出了三种新颖的头部姿势估计特征,它们是切片几何中心描述子、切片局部深度描述子和切片局部方向描述子。其中,切片几何中心描述子采用切片几何中心的归一化坐标来描述切片随头部姿态的变化规律,具有抗噪声能力强的特点;而切片局部深度描述子则不仅使用切片的方式沿像素值增长方向提取局部特征,而且还借鉴LBP的思想在切片图像上提取局部特征,把“局部”的思想运用到了极致;最后,切片局部方向描述子综合切片几何中心描述子和切片局部深度描述子的优点,既借鉴了切片局部深度描述子“多重局部”的思想,又吸纳了几何中心描述子高鲁棒性的特点,具有精度高和鲁棒性好的特点。   ④在借鉴积分图思想的基础上,设计了切片坐标积分数组、切片深度积分图和切片坐标积分图,将切片几何中心描述子特征、切片深度描述子特征和切片方向描述子特征的抽取工作简化为简单的减法和除法,分别实现了三种描述子特征的快速提取算法,从而保证了头部姿势估计方法的实时性。并且,以当前流行回归方法为工具,实现了三种实时头部姿势估计方法。   ⑤融合切片局部深度描述子和切片局部方向描述子的特点,设计并实现了一个由粗到精的头部姿势估计系统;同时,基于微软Face Tracking SDK提供的鼻尖位置,实现了一个基于切片方向描述子的实时头部姿势估计系统,并将其应用于人脸识别,提高了人脸识别的易用性。   本文的工作为进一步开展人脸识别、视线估计等相关研究打下了坚实的基础。
其他文献
篇章关系是文本中的组成部分彼此之间的语义关系,篇章语义关系分析是自然语言处理中的一个基本任务,很多其他任务都能从中受益。本文对篇章关系的关键技术进行了研究,对篇章关系
众包是互联网环境下一种新兴的分布式解决问题的生产方式。众包模式可帮助企业获得全球化的人力资源,显著降低开发成本,提高生产效率。采用众包模式开发软件是未来软件发展的一
随着人类对于软件的使用越来越广泛普遍,研究越来越深入,对其精确度的要求也越来越高。程序的语法错误可以在相应的平台上完成检测,但是并没有完成程序逻辑检测。针对软件逻辑错
信息技术的进步和计算机软硬件技术的快速发展推动了计算机系统的大量普及。启动速度是衡量计算机系统性能和用户体验的重要指标之一。提升计算机系统启动速度具有重要意义。
矩阵是一种非常重要的基本数据结构,它在电子商务、社会网络、信息检索等领域都有广泛的应用。如今这些领域处理的数据量越来越大,而过去对矩阵运算的研究多集中在单机算法,用户
自动文本摘要通过计算机技术完成对文本的分析,并能够自动生成摘要以及实现对内容的总结,能够帮助用户尽快获取可用信息,并有利于用户对自身兴趣的定位。对自动文本摘要的研究,在
随着计算机计算能力的迅猛发展,计算机所能处理问题的规模越来越大,提高计算的可信性和高效性已成为工业界和科学界的共同目标.符号计算可以得到问题的精确结果,但计算复杂度高;
多媒体技术和互联网的高速发展促使图像视频信息爆炸式增长。随着多媒体处理技术的不断发展,视频技术正朝着超高清和立体的方向发展。在过去的二三十年间,视频编码技术得到了广
软件产品结构是软件工程领域的一个研究热点。在软件的再开发、缺陷修复、新人进入、遗产软件维护等开发活动中,了解软件的产品结构都可以帮助提高开发效率和产品质量。但是,在
在影视制作的过程中,制作影视特效的目的就是把电影中难以表达的场景,呈现给观众。或从降低成本的角度考虑,在降低了成本的同时又能给观众带来较好的观影感受。对于包含大量人群