基于模型的手势跟踪及相关技术的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:rian2sd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速、准确的手势跟踪系统具有广阔的应用前景。由于特殊的穿戴式硬件造价高昂,并且设备本身还会限制自由,因此近年来,基于廉价摄像机的手势跟踪系统成为了人本界面的重要研究课题。然而,无论是人手运动的复杂性,还是摄像机本身的噪声、运动模糊与低分辨率,这个课题都对计算机视觉的相关技术提出了挑战。本论文对如何构造一个快速、准确的手势跟踪系统及其相关技术进行了研究。主要内容和贡献归纳如下:  (1)基于单个深度摄像机,我们提出了一个实时、鲁棒、基于模型的手势跟踪系统,它可以跟踪人手运动的所有自由度。为解决系统的初始化以及跟踪丢失问题,我们结合人手深度图像的表观特征提出了一种搜索算法。该算法能从含有大量预渲染手势图像的数据库中快速地检索到若干结果,并将它们用于优化器求解的初始点。在优化阶段,我们提出了一个鲁棒的目标函数,以及一种基于重新采样策略的粒子群优化算法。该算法在同样的迭代次数下能更快地找到目标函数的最优解,并且可以借助GPU加速。我们的系统在一块低端GeForce GTX580 GPU上可以达到40帧/秒的跟踪速度,并且能够自动初始化以及从跟踪丢失中恢复。  (2)针对深度摄像机的图像噪声,以及双目摄像机手势跟踪如何获取深度的问题,我们提出了一种常数时间复杂度的加权中值滤波算法。该算法可以利用一幅RGB图像提供权重,来去除同样场景下的另一幅RGB/深度图像的噪声/异常值,并很好地保持物体的边界。这个快速算法使得以往因时间代价过大而无法进行的研究成为了可能。我们将该算法用于增强稠密立体匹配的结果,并得到了一个崭新的发现:有了我们的算法作为后处理,匹配代价聚合甚至只需要使用简单快速的箱式滤波,最终结果却可以与近年来提出的复杂聚合算法十分接近。我们的算法很容易借助GPU加速,从而得到一个实时的立体匹配系统。在手势跟踪中,我们的算法可以利用RGB图像的信息,以保边的方式去除手势深度图像的噪声。甚至在图像处理的其它领域,例如风格化绘制、卡通图像JPEG压缩噪声的修复中都有很好的性能。  (3)快速的人手/相机运动容易导致图像模糊,从而降低立体匹配和手势跟踪系统的精度。但快速的去模糊算法往往假设输入图像被周期延拓,而边界处的不连续会导致最终结果产生严重的振铃效应。已有方法通过反卷积平滑延拓后的图像以抑制振铃效应,但需要求解大型线性方程组来计算延拓区域。对此,我们提出一种快速的计算方法。通过简化延拓区域的定义,并用改进的卷积金字塔进行图像延拓。实验结果表明,在不影响精度的前提下,我们的算法可将延拓区域的计算速度提高两个数量级以上,有效地抑制振铃效应。这在需要实时去模糊处理的手势跟踪系统中具有很强的实用性。
其他文献
AJAX是当前Web客户端技术研究的热点,通过Java Script与DHTML提供一种异步编程模型,从而提高网页的交互和响应能力,为用户带来更好的人机体验。JSF是SUN新的Web应用开发框架,提供
当今科学研究呈纵横两方向发展,纵向各学科分支越来越细,越来越深入;横向各学科联系越来越紧密,把某个领域成熟的思想进入到另一领域往往能产生较好的科研成果,模拟生物系统进行科
网络通信技术发展到今天,有着辉煌的成就,它的发展使人们沟通便利,交际自由,是现代化一个重要标志。即时通信软件是人们上网交际的常用工具,使用即时通信工具能够实现与好友即时,快
软件演化是一个程序不断调节以满足新的软件需求的过程,即是对一个已有的软件系统进行不断修改、补充和完善,以适应新的需求和环境变化的过程。软件演化已成为如今软件工程领域
软件演化已成为软件生存周期中最重要的形态之一,进入了软件的各个领域,成为了今天软件工程研究的热点领域。软件演化的过程表现出了明显不同于传统软件过程的特征。因此,有必要
数据分类技术是数据挖掘中一种强有力的分析手段,它旨在生成一个分类函数或分类模型,由该模型把数据库中的数据项映射到某一给定类别中。现有的数据分类算法大体可以划分为两大
数据挖掘是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。数据挖掘技术经过十多年的发展,已经逐渐建立起系统的挖掘理论和成熟的挖掘
数据挖掘是在海量的数据中提取隐含的、未知的、潜在有用的知识或信息模式的决策支持方法。在信息爆炸的今天,数据挖掘显得尤为重要。 一个人的噪声可能是另一个人的信号,忽
随着移动通信的迅速发展,移动通信业务从传统的话音业务向以Internet接入和多媒体业务为主方向发展的趋势已经清晰可见。未来移动通信的目标在于建立一个无处不在的全IP分组数
真实感图形渲染是计算机图形学发展的一个重要方向,而目前的渲染技术都是基于物理的方法,通过模拟光线在场景中反射及折射反映出场景中的光照情况,从而通过计算光能来渲染出场景