面向交互语义的用户基本手势实时检索方法研究

来源 :济南大学 | 被引量 : 6次 | 上传用户:huhu39
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的发展与应用,人与计算机的交互越来越密切,人机交互技术随之应运而生并极大的改变着人们的工作和生活方式。手势交互作为人机交互技术中重要的一环也越发引起科学家们的关注,如何实现自然、和谐、实时的手势交互已经成为手势交互领域研究的热点问题。基于视觉的手势交互不需要人手佩戴任何电子传感设备,仅需一个或多个摄像头对人手进行跟踪和识别来完成手势交互,因而满足自然、和谐的交互方式。在基于视觉的手势交互系统中手势识别技术决定交互能否顺利完成。基于视觉的手势识别是指利用摄像头捕获人手图像并把图像信息传输到计算机中,经过图像处理算法让计算机判断出人手的交互意图并执行对应的指令从而完成最终的人机交互。手势检索的实时性也影响着交互的自然性,如何实时的对人手进行检索和识别是本文的核心研究目标。从理论上说,在单目摄像机条件下,让用户的实时手势动作与检索出的对应3D动画可视化过程保持一致,是一件极有挑战性的工作,具有重要的学术价值;从应用背景的角度看,3D交互界面是未来人机界面的重要发展趋势,故这种研究对于构建自然手势输入的三维直接操控界面研发具有巨大的潜在应用价值。本论文依托国家自然科学基金(No.61173079,No.61472163),山东省自然科学基金重点项目(No.ZR2011FZ003)等项目基金的支持,对单目摄像头下用户基本手势实时检索方法进行了研究。本文具体研究内容及创新点如下:(1)实现了基于肤色特征的手势分割方法。首先选取YCrCb颜色空间,然后应用高斯混合模型进行肤色建模,并根据阈值法完成手势的分割。在手势初始化阶段对手势肤色区域进行实时采样,接着根据采集的样本计算出高斯混合模型的各个参数,这种方法增加了对光照条件的适应性,减小了光照对手势分割的影响。(2)提出了基于手势主方向的特征提取方法。手势主方向是指从手势重心点到手势最远点的一个方向向量,提出手势主方向的目的是保证手势特征提取的一致性,解决手势在发生缩放、平移和旋转等情况下给手势识别带来的问题。在手势预处理阶段,首先把分割出来的手势图像进行标准化处理,使之在手势识别阶段不受手势缩放的影响,然后在标准化手势图像中求出手势的主方向,并依据手势主方向建立二维手势直角坐标系对手势进行特征提取。(3)提出了手势二进制描述子的概念。由于在运算复杂度和存储开销方面二进制描述子都有着很大的优势,有利于实时性的运算。为了提高手势识别阶段手势检索的速度本文提出了手势二进制描述子的概念。手势二进制描述子用一个二进制串表示,其中二进制串的每一位代表一个维度,用于表示一个手势特征区域中手势特征点数目的信息,从而整个二进制字符串就反映了整个手势区域中手势特征的信息。(4)本文通过大量统计实验求证了动态交互语义手势存在一定的规律性。在手势抓取的过程中,手势像素点个数线性减少;手势放开的过程中,手势像素点个数线性增大;平移过程中手势像素点个数线性不变;旋转过程中手势像素点个数先线性减少后线性增大。因此,在手势检索之前可以先根据此规律识别出交互语义手势的类型,缩小手势检索的范围,从而进一步提高了手势检索的速度。(5)本文提出了一种基于手势二进制描述子和类-Hausdorff距离的手势检索算法。首先,利用手势主方向提取手势特征,然后根据交互语义手势的规律性初步识别手势的交互类型,接着应用手势二进制描述子匹配算法从三维手势动画库中筛选出一些候选手势动画,最后用类-Hausdorff距离方法从候选手势动画中检索出与用户交互意图相一致的手势动画。实验结果验证了本文算法具有很好的实时性,同时也能保证较高的手势识别率。
其他文献
在安全事件中,恶意代码造成的经济损失占有最大的比例。恶意代码的检测技术总是滞后于新恶意代码的出现。一方面是人们很难区别正常代码和恶意代码;另一方面,很多信息系统缺少必
搜索引擎是互联网用户最常用的信息查询工具。目前主流的搜索引擎并没有明确区分不同用户的查询意图,而不同用户即使输入相同的查询词,其查询需求也是有差别的。个性化信息检
随着现代科学技术的发展和工业的发展,人们对钢的质量(如钢的纯净度)、使用性能、炼钢生产率及成本等方面,都提出了越来越高的要求。电弧炉炼钢已经不能满足要求了,因此精炼炉底吹
随着越来越重视软件测试在软件工程中的重要作用,人们对软件测试的投入也随之增多,自动化软件测试替代手工测试将是软件测试的主流趋势。网络技术的迅速发展使得分布式应用软
随着信息技术的发展,Web上的数据日趋成为当今数据的主流,但是分布在Web上的数据多是异构的,并不是真正意义上统一的可直接利用的信息资源,为了实现信息共享,必须有一种系统
手写体数字识别是目前模式识别领域众多研究者关注的一个热点,是信息录入的关键步骤,广泛应用于公安、税务、交通、金融、教育等行业的实践活动中。目前识别的方法是多种多样
手语是由手及手臂的运动并辅之于脸部表情及体势来表达思想的一种人体语言,是聋哑人之间进行交际的重要工具。计算机手语识别研究的目的是通过计算机及采集设备获取手语信息,
运动目标的检测与跟踪技术是计算机视觉和图像编码领域的重要研究课题之一,在安全监控、军事制导以及智能交通等方面都有着重要的研究价值和应用前景。   本文首先介绍运动
视频质量评估的研究是图像信息工程的基础技术之一。在视频通信应用中的视频传输技术,视频处理中的编码压缩技术和视频恢复技术,所有这些技术不论优劣都会在一定程度上影响到
被动测量由于对网络运行无干扰,测量数据能真实地反映网络行为,所以被广泛应用于网络测量工作和网络行为学研究。本论文的研究工作基于CERNET华东(北)地区网络中心,为了支持网络