基于认知行为模型的语义手势识别算法与应用研究

来源 :济南大学 | 被引量 : 8次 | 上传用户:xiao5playgame
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人机交互日趋成为国内外研究的热点之一。用户与虚拟系统的交互也成为人们探索的重点。人手作为人类交流的一种重要方式,自然而然成为科学家们的兴趣点之一。如何通过人手指令信息与虚拟系统进行交互是一项重要的研究课题。传统的人机交互多借助于诸如数据手套、位置跟踪仪之类的外部设备进行交互。这些交互方式比较笨重繁琐,限制了人类的交互自由,违背了人类自然交互的意愿。基于视觉的手势交互通过对自然人手的动作信息进行捕捉完成同虚拟系统的交互任务。基于视觉的手势交互一般仅需要一个或者多个摄像头来记录手势信息,人手不需要佩戴其他电子设备,摆脱了可穿戴式电子设备的束缚。基于视觉的手势交互研究一般包括手势分割、跟踪、特征提取和识别四个部分。手势识别在人机交互领域占有十分重要的地位。准确的手势识别能够保证交互的顺利进行。本论文依托国家自然科学基金(No.61173079)“基于认知机理和手势动画的三维人机交互界面研究”和山东省自然科学基金重点项目(No.ZR2011FZ003)“面向自然人手跟踪的3D人机交互界面中的关键问题研究”项目基金的支持,对单目摄像头条件下的手势识别问题进行了研究。具体研究内容如下:(1)建立了基于单目摄像头的虚拟装配平台。主要运用OpenGL、OpenCV、3DMAX等技术实现该装配平台的搭建与组装。通过摄像头获取人手的图像信息,虚拟系统接收到人手图像信息后对其进行分析处理,并根据得出的手势分析结果作出相应的交互反应。(2)手势分割和特征提取是手势识别的重要前提。本文对RGB空间下获取的手势肤色特征进行高斯建模,采用训练好的高斯模型进行手势分割。特征提取方面,我们使用了基于二值图像的密度分布特征方法和轮廓点检测方法进行提取。密度分布特征的方法具有平移不变性、缩放不变性和旋转不变形的优点,轮廓点检测的方法能够将指尖有效地提取出来,从而得到比较准确的手势图像特征参数。(3)本文提出了两种语义手势识别方法:区间比例算法和图像融合法。首先提出了一种语义手势的概念,并对其进行了简单的分类。区间比例方法通过对手势图像的有效分区获得有效特征,并采用欧氏距离的方法进行手势识别;图像融合法则是将语义手势的所有动态图像信息融合在一幅图像中,通过对一幅静态图的识别完成语义手势的识别。这两种方法都有令人满意的识别效果。(4)本文将认知心理学的相关理论成果用于本文的研究,提出了一种认知行为模型进行语义手势的识别。首先,分析本文建立的虚拟雪人装配场景,设置手势的识别点,选用大量的实验者来获取认知信息,并训练基于该交互场景的转换概率矩阵,获得稳定的转换概率矩阵。然后在该场景下重复本文定义的语义手势动作,获取语义手势的DDF特征,为每一种语义手势建立基于DDF特征的HMM模型,从而建立了基于特定交互场景的认知行为模型。模型建立后,进行多次试验对语义手势进行识别检验。实验结果表明,基于认知行为模型的语义手势识别能够很好地适应特定的交互环境,同时具有较高的识别率和较好的时间效率。
其他文献
随着智能手机的不断普及与手机上网用户的持续增多,个人手机安全问题越来越多的得到了关注。Android平台作为近几年来新兴的手机操作系统,市场占有率达到智能手机的一半以上
运动目标的跟踪与识别作为计算机视觉的一个核心研究课题,相关算法如雨后春笋般出现。跟踪的目标及场景的差异,导致跟踪算法的选择也不尽相同的,这就需要在算法设计阶段能够
图像分类在计算机视觉研究领域中是一个热点问题,一直以来备受学者关注,尤其是近些年来,数字图像的规模呈现爆炸式增长态势,图像分类已成为许多领域的一项关键任务,因此其研
WLAN已经成为国内三大运营商的建网重点,运营商对WLAN网络的建设已经从初期的建设期发展为建设与运营并行考虑的时期,既要考虑如何在扩建、提速下有效维护、优化WLAN网络,实
离群点是指数据集中和常规数据对象的产生机制完全不同的,不符合数据的一般规律,偏离常规数据对象的数据点,但是它们又可能包含着我们容易忽略的非常重要的信息。如在信用卡
目前,很多监控应用会在固定位置设置一些捕获设备对运动实体进行追踪,从而产生大量时空轨迹数据。例如在交通管控系统中,安装在道路上的智能摄像头会自动拍摄并对过往车辆进行识
“大数据”已成为近年计算机信息技术行业关注的热点。如何利用现有技术挖掘出数据背后隐藏的丰富信息,进而创造更高的经济价值,是大数据发展的问题之一。可视化挖掘技术以图形
脑-机接口(Brain-computer interface, BCI)是一种不依赖外周神经和肌肉等传统信息通道的特殊人-机交互技术。利用该技术,可实现大脑与外部设备之间的直接通信和控制。作为神
近年来,随着宽带互联网的迅速发展以及网民数量不断攀升,互联网上的广告推送服务迎来了新的商机,已经得到了众多的门户网站、购物网站以及社交网站等的关注。在互联网广告推送服
随着5G时代的到来和物联网行业的快速发展以及人们安全和隐私保护意识的增强,安全和隐私保护变得越来越重要。近年来在云计算的基础上,雾计算、边缘计算等近端云计算模式发展迅