三维人脸识别关键问题研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:qinghuawuqiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用人脸的空间形状结构信息进行分类的三维人脸识别是人脸识别领域新的研究热点,人们寄希望于它能解决传统二维人脸识别的光照、姿态、表情变化的瓶颈问题,目前正受到广泛的关注,初步的研究成果令人鼓舞。   三维人脸识别系统目前研究热点主要包括数据获取、特征点检测、建模、去噪、特征提取、分类器设计、与二维人脸信息的融合等关键性问题。本文针对其中的特征提取、分类器设计、多模态融合等三个问题进行了研究。文中主要工作与贡献包括:   1.在特征提取方面,提出了一种基于几何特征和关联特征统计量的特征提取方法。一方面从全局统计的角度分析比较了传统的几何特征,如深度、曲率等:另一方面提出关联特征来描述人脸的三维结构,并提出了一种三维局部二值模式描述子(3DLBP)来描述三维人脸的关联特征:最后融合几何特征和关联特征统计量形成一种可分性好的三维人脸特征。   2.在分类识别方面.提出了一种基于类内类间深度差直方图统计量的识别方法。人脸的深度图像的象素值直接反映了人脸上每点的三维深度信息,他们的相减差就直接反映了两幅人脸结构特征差异。与灰度差异会受到光照变化的强烈影响不同,这种深度差异只受预处理配准误差和表情变化的影响。我们采用计算局部最小差异绝对值来代替两幅深度图像的直接相减,并提出三种框架来融合局部匹配和全局匹配,以减小配准误差和表情变化的影响。实验结果表明经过两步改进处理,两者的影响小于不同人脸的差异影响,所提出的的方法取得很好的识别效果。   3.在多模态融合方面,研究分析了目前融合二维和三维信息的人脸识别的研究现状,并做了一些尝试性探索。我们将局部GABOR二值模式算子应用于三维人脸识别,并比较分析了一些常见的融合方法的融合性能。   总的说来,本文对三维人脸识别的特征提取、分类识别、多模态融合等环节做了一些初步尝试和探索。
其他文献
客户关系管理是一个系统性的工程,是技术和管理相结合的产物。作为企业信息化的最新发展,客户关系管理实现了企业由以产品为中心向以客户为中心的转变,客户首次作为一种资源纳入
随着数字技术与计算机技术的迅速发展,数字音频工作站(Digital Audio workstation,简称DAW)出现,并且迅速替代了传统音频工作站,在广电领域内占据重要位置。广播电台的稳定性
自动人脸识别的研究有着重要的学术价值和广泛的应用前景。本文沿着统计学习与融合的思路对人脸识别中的对齐、特征表达和分类器的训练及构造三个关键问题进行了深入的研究。
随着电子通信技术的高速发展,特别是近年来移动互联网技术的发展与普及,人们对高性能、多功能、低功耗移动终端的需求更加迫切。但是随着移动终端功能的不断增多、处理性能的
基于OCR的图文库检索方法有非常广泛的应用前景。将纸质文档以图像方式保存,但却利用文档图像的文字识别结果进行检索,这使得纸质文档的保存与检索都非常方便。但出于OCR的识别
定位是移动机器人研究中一项重要的内容,也是实现导航等其他功能的前提和保证。机器人视觉是智能机器人的一个重要分支,主要完成对外界环境的感知、描述、识别和理解,是产生行为
视频监控系统是集多媒体信息的综合、计算机的交互性、通信的分布性和监控的实时性等技术与一体的综合系统。并且随着信息化产业技术的高速发展,视频监控系统已逐步涵盖到多媒
计算机视觉研究的一个主要目的是从二维图像恢复三维物体的几何结构。为实现这一目的,通常需要图像匹配、摄像机标定和三维结构计算三个步骤,其中摄像机标定是不可或缺的一步,而
模仿和学习一直被认为是入脑智能的主要体现,让机器人模仿灵活的人体运动是人类的美好愿望,也是机器人智能的重要体现。基于标记点和运动捕捉系统的人体运动模仿系统已经比较成
目标跟踪是计算机视觉领域中的一个具有挑战性的问题。目标跟踪的任务是根据给定的目标观测序列(信号或图像),估计目标的时变状态(动态的几何或物理属性)。目标跟踪成功的关键