论文部分内容阅读
人体行为识别近几年来受到了广泛的关注,成为计算机视觉和模式识别领域的研究热门,并且在人机交互、虚拟现实、智能监控、智能家居等方面得到了广泛的应用。目前该领域的研究已经取得一些进展,但由于人体运动本身的复杂性(阴影、遮挡)和场景的多变性(光照、视角、分辨率),人体行为识别依然是一个具有挑战性的课题。
本文通过提取正弦级数特征来描述人体运动的姿态特征,姿态特征是人体的高层语义信息,与底层的图像信息相比,可以用它来更准确的描述人体的行为。本文主要包括目标检测、特征提取与描述和行为识别三部分,并通过实验证明文中提出方法的有效性。
首先对运动目标检测算法进行研究。对常用的运动目标检测算法原理进行阐述,并对常用的检测算法进行比较和分析,在此基础上采用一种改进的基于背景差分和帧间差分融合的目标检测算法进行前景检测;对前景检测提取的目标区域进行的后期处理方法进行研究,包括基于RGB和HSV颜色空间的阴影消除算法,形态学滤波,连通域分析和区域目标融合。
其次对行为特征的提取和描述方法进行了研究。对现有的特征描述方法进行介绍,并对各种描述方法的优缺点进行比较和总结,在此基础上提出人体行为描述特征的选取原则;详细阐释了本文提出的正弦级数描述特征的工作原理。
然后对行为识别方法进行了研究。对当前流行的行为识别方法进行介绍,并对各种识别方法的优缺点比较和分析,总结了每种识别方法的适用范围;针对本文的研究对象和提出的行为特征描述算子,提出了基于正弦级数特征的行为识别方法,正弦级数特征的核心在于利用正弦级数将特征变换到欧式空间,并采用提出的公式进行行为识别。
最后对文中提出的方法进行实验。通过在Weizmann行为识别数据库上进行一系列准确性和鲁棒性实验,并与其他已发表文献实验结果的对比,证明了算法的有效性。