实时手势识别在人机交互中的应用

来源 :上海海事大学 | 被引量 : 15次 | 上传用户:guaiguaiwdairen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势是人们生活当中一种自然而直观的人际交流模式,随着人机交互逐渐向以人为中心转移,对手势识别的研究也逐渐成为人们研究的热点。它为使用者提供了虚拟环境之间进行自然交互的手段,这是人们最渴望的人机接口技术。 然而,由于手势本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性的多学科交叉研究课题。 手势分为动态手势和静态手势,动态手势定义为手运动的轨迹,而静态手势强调通过手型传递一定的意义。本文研究的实时手势识别以特定的手型表示特定的意义,同时一定的动作产生一定的结果。本文结合上海市自然科学基金资助课题“手势识别和手势合成”,对实时手势识别及其在人机交互上模拟鼠标操作的应用进行一定的研究。 本文的实时手势识别和应用的过程大致分为五个部分:视频实时采集、图像预处理、手势图像特征提取、识别和人机交互(鼠标驱动)。在视频采集部分,我们采用USB摄像头对手势进行摄取,结果为320*240像素的32位真彩色位图。在手势图像预处理部分,对采集的图像进行各种处理,包括灰度化、二值化、平滑,轮廓提取等操作。 在手势特征提取,本文采用了基于手势图像几何特征的方法,分析各种手势在图像空间的分布特征,统计像素点的直方图分布规律,最后在其中挑选了几种具有很大区分度的特征,其中既有局部特征,又有整体特征。识别方法本文采用最后通过基于拒绝策略的决策树的方法进行识别,通过对几个特征的层层决策,判定手势的类型,把识别结果通知驱动模块。最后,驱动模块比较前一帧的识别结果,用一定的判定规则最终确定相应的消息响应,形成相应的鼠标操作效果。 采用以上的方法,在实验中对一段视频的600个连续手势进行识别。在识别准确度上,各种定义手势的识别率为73.99%,而产生的交互响应正确率为100%;在时间上,系统响应延时基本保持在0.5秒之内,基本上达到人机交互的基本要求和实验的期望结果。
其他文献
藏品保护和藏品利用是传统博物馆面临的一对功能矛盾,数字博物馆是解决这对矛盾的有效技术手段,它是以采集、保护、管理和利用人类文化和自然遗产信息资源为目的而建立的信息网
因特网的普及使计算模式继主机计算和桌面计算之后进入普适计算模式。这种全新的计算模式将使计算机不再局限于桌面,而是嵌入到我们的工作、生活空间中,变为手持或可穿戴的设
符号模式矩阵是组合矩阵中当前国际上十分活跃的一个研究课题,其重要原因之一是它在经济学,生物学,化学,社会学,计算机科学等众多学科中具有广泛的实际应用背景。符号模式矩
近年来,为了适应日趋激烈的竞争环境,企业软件在企业的管理中发挥着越来越重要的作用。在企业软件的开发过程中,由于系统庞大,用户的需求各不相同,所以需求分析和建模过程就
能源作为经济增长和社会发展的根本动力,在国际上具有十分重要的地位。在中国经济对能源日渐依赖的背景之下,能源问题早已经成为了人们日渐关注的问题。其中,能源价格问题是整个
多代理调度是拥有独立工件集的代理根据各自优化目标竞争使用共享资源,带有学习效应和退化工件的多代理单机调度是近几年新出现的研究问题,但由于多代理下的工件交替加工而导致
Internet和Web技术的发展为现代办公自动化系统提供了新的管理理念和技术支持。基于J2EE的柔性办公自动化系统通过构建一个开放性的办公环境,克服了传统办公系统功能单一、难
移动数据业务发展到今天,历经“蛮荒期”、“规范期”后,最终要进入到“成熟期”。如何以用户为中心,为用户提供优质的数据业务服务,催生了数据业务深度运营的管理需求。对移动数
高等学校多年来的教学和管理中积累了大量的数据,目前这些数据还没有得到有效地利用,只是一个待开发的“宝藏”。数据挖掘可以从大量的数据中提取隐藏在数据背后的有价值信息
如今,手持设备的硬件水平逐步提高,多种功能的传感器都可搭载在智能手机终端上,这使得以手机设备为主的移动感知技术逐渐升温,进而演变出了一种新型的数据信息社会化生产模式