论文部分内容阅读
随着现代科学技术,特别是计算机技术、通讯技术、电子技术、传感器技术、控制技术以及人工智能技术的飞速发展,人机交互技术己经被广泛地应用到科学研究、工农业生产、军事、医疗卫生、交通等许多领域。基于手势的人机交互以手势表达交互意图,手势中含有大量的交互信息,同时又符合人的认知习惯,因此,基于手势的人机交互研究成为了当前研究的热点,然而由于手不是刚体,存在形变,因此目前很多跟踪算法在跟踪过程中经常会出现失误,影响人机交互结果;另外,是因为使用背景的复杂性,目前的算法在去除背景时还存在一定的不足。尽管微软推出了Kinect Box 360人机交互平台,具有较好的性能,但成本太高,不利于智能家电等手势人机方面的应用。因此,一种基于普通摄像头的人机交互系统不仅具有重要的理论意义,同时也具有重要的经济价值和应用价值。本文紧密结合实际应用需求,研究了图像去噪、手势检测与手势跟踪等算法和相关实现技术,主要内容和创新性贡献如下:(1)针对高效去除椒盐噪声和有效保留图像细节的技术要求,提出了一种基于PCNN(Pulse Coupled Neural Network)的自适应窗快速去噪方法ADEN(Adaptive Denoising method for Extreme Noise)-PCNN。本方法引入了噪声甄别机制,只对被污染的像素进行去噪处理,因而能够保证在去噪的同时不损坏图像信息,使图像细节和纹理信息得以有效保留。为了确保图像质量,在面向图像降噪的PCNN神经网络阵列结构中引入了自组织机制,可以自动地估计噪声的强度信息并进行PCNN网络中神经元连接方式的自组织转换。此外,还引入了自适应机制,可根据噪声强度的估计信息,自动进行滤波次数的优选,增强自适应能力。实验结果表明,此方法较之常规方法和其他同类方法在去噪效果和保留图像细节信息方面具有明显的优势。(2)为了实现跟背景无关的手势检测,设计了基于Cascade Ada Boost技术的手势分类器。众所周知,复杂背景下的手势提取一直是图像处理领域中的难点,传统的基于背景差分的目标检测方法、基于高斯混合模型的背景建模方法、帧间差分法都不能满足实际中的应用需求。背景差分方法和高斯混合模型的背景建模方法都要求背景固定不变,但在实际过程中,背景经常是变化的,因此,这种方法通常只能在实验室环境或要求很严格的环境,还对于面向智能电视的应用环境而言,这两种方法都不能胜任;帧间差分法也存在两个方面的问题,一是要求场景中只有一个运动,二是要求光照要保持恒定,但这对面向智能电视而言的用户而言这些要求很难保证,此外,基于背景差分的方法不能准确的提取出手势目标,这将影响后面的跟踪特征点的提取,导致跟踪失败。因此,提出一种与背景无关的手势目标提取方法对基于手势的人机交互什么重要。针对此,本文借助人脸检测技术通过大量的样本训练,设计了一种高效、准确、实时的手势目标检测方法,该方法具有很强的鲁棒性和低的虚警率。(3)提出了自适应的目标跟踪策略,解决了传统KLT算法的不足。实验结果表明,本文算法在跟踪目标的准确性、可靠性和鲁棒性方面要明显地优于KLT算法和Cam Shift算法。这主要归因于以下几个策略:滤波策略:减少了噪声和光线变化对KLT跟踪算法的影响;前向后向误差策略和可靠性度量准则:减少了误跟踪的影响;特征点添加机制:减少跟踪过程中物体形变导致跟踪特征点减少的影响。