基于视觉的中国手语识别相关技术的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:guocheng2244
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是聋哑人日常交流必不可少的手段.作为一种高度结构化的手势语言,其研究涉及到多个学科,尤其是模式识别和人工智能的基本研究案例.同时,手语识别可以辅助聋人使用手语和正常人交流,进行机器人的示范学习并可以作为虚拟现实系统中的多模式接口等.基于视觉的手语识别可以提供较为自然的人机交互方式.因此无论从理论还是应用角度都有较高的研究价值.综合现在的研究现状,视觉手语识别还存在以下的问题,比如:特征提取的鲁棒性和速度有待于提高,隐马尔可夫模型对于手语中的某些词并不能很好的区分,徒手的视觉手语识别中缺乏有效的特征描述方法等.针对上面的问题,该文进行了了如下的研究工作:1.为减少光线和背景因素的影响,并能提高前端视频预处理的速度,我们采用基于颜色通道的背景去除方案取代颜色和边缘通道相结合的方案.提出了一种动态的预测和更新背景去除和双手检测的方法,通过缩小目标搜索范围来减少系统的运行时间.2.在中国手语中存在着一类词,它们具有相似的运动趋势,但在运动方向和运动幅度上有较细微的差别,常规的隐马尔可夫模型往往将这些词错误识别,针对这类问题,提出了基于条件线性高斯的自回归隐马尔可夫模型(Auto-regressive Hidden Markov Models or ARHMMs)来对手语词进行建模.给出ARHMM各个参数的估计公式,包括回归矩阵和协方差矩阵的估计.并提出了将HMM和ARHMM方法相结合的双层识别结构,来充分利用两种模型的优点.识别结果由原来的92﹪达到96.6﹪.3.在徒手视觉手语识别方面,提出了多尺度形状描述子的概念,并将其应用于手势建模和静态的手势识别.该方法利用圆形的轴对称和中心对称性质,考察每一手势在圆周上的肤色与非肤色区域的分布,并从多个尺度来描述每一手势.具有旋转和尺度放缩的不变性.该方法可以解决手势的精细刻画问题并可以对相似手势进行区分.
其他文献
随着无线通讯技术、嵌入式分布式计算的发展,感知网应运而生.它"无处不在的感知"能力,动态自组织性、扩展、低成本等特点使它广泛地应用于国防、环境监测、城市交通、健康医
随着网络的不断发展,用户对网络的需求不断发生变化,要求传输的信息种类越来越多,要求提供的服务质量也越来越高.传统网络的弊端日益突出,甚至限制了网络的进一步发展.主动网
该文提出了基于知识的产品开发集成系统产品开发的领域知识描述模型,以及过程形式化表示方法,研究了其中的过程信息管理、集成系统层次结构、集成水平及各种智能辅助工具的层
随着Internet的快速发展,人们对Internet提供的服务有了更高的要求,越来越多的新业务要求IP网络不仅能提供信息传输的可靠性,而且要能对信息传输的过程具有可预见性,用户要求
外汇市场上风云变幻,难以琢磨,高收益与高风险并存。在每天的交易中,为了控制风险,交易员和客户要随时掌握各种货币的汇率和走势的实时行情及外汇市场的多种消息等等。只有对市场
语义网旨在帮助网络服务自动化、深层次网络的数据集成,提供语义含义的互动,Internet知识发现和更多精确的搜索。实体论在语义网中扮演了重要的角色,提供了一种共享和精确定义的
汉英双语语料库的研究,除了要面对一般双语文本加工的问题外,还要处理汉英之间相互转换的特有难点.为此该文采用了理性主义和经验主义相结合的策略来探索基于双语语料库的机
随着测井技术向成像化和组合化方向发展,新型测井仪器被广泛应用在各油田,传送的数据量越来越大,因而开发高容量、高效率的通信系统以解决通信瓶颈成为数控测井技术研究的热
水下声源被动探测是水声领域中的重要问题,传统的被动探测方法多基于使用一个探测节点,立足于一个观测点对声源进行探测,观测角度单一,空间分辨能力也有限,分布式阵列为水下声源被
本文研究并分析了CDN和P2P技术的优缺点,并对CDN-P2P融合网络的特点进行了研究,针对其下载过程,从P2P网络的节点组织结构,资源搜索策略以及CDN网络中的副本放置策略等三个不