论文部分内容阅读
本文以运动人体行为作为主要研究对象,以行为识别方法为研究内容。通过“时空兴趣点”获得极具价值的行为底层特征信息,通过“视觉词袋模型”得到行为特征的人体行为知识词典,通过行为特征训练学习产生人体行为模式。主要工作体现在以下四个方面:(1)深入研究基于时空兴趣点的人体行为识别方法。对Harris-3D、高斯和Gabor滤波器以及梯度信息这三种时空兴趣点检测描述方法做了研究和分析,建立了目前最流行的人体行为识别数据集下的人体行为识别算法原型框架(包括视觉词袋模型和行为模式分类),并通过实验选择和确立了本文的时空兴趣点检测方法以及时空兴趣点提取规模。(2)提出了金字塔匹配核的视觉词袋模型构造算法。针对原视觉词袋模型中在表达人体行为时忽视词序的问题,提出了按照时空兴趣点的词序关系重新构造视觉词袋模型,并在构造中考虑规模和视觉词汇关系,构造算法采用金字塔匹配核算法,将无序特征转换为核特征,解决了基于词序关系的视觉词袋模型构造。实验结果表明,该视觉词袋模型能很好的表达人体行为,提高行为识别精度。(3)提出了多维空间聚类的视觉词袋模型构造算法。在原视觉词袋模型表达的人体行为特征中,并未考虑时空兴趣点间的空间位置关系,提出构造多维时空坐标聚类生成时空子区域,用时空子区域直方图联合表示行为特征,解决了视觉词袋模型中多周期行为的位置重合问题。实验结果表明,该视觉词袋模型引入了空间位置关系,提高了行为识别精度。(4)实例化应用实现:常见的课堂行为的识别。在上述研究的基础上,研究和分析了课堂教学中的主要行为,并以视频方式录制了191段6种行为。实验结果表明,本文提出的算法在课堂行为数据集上具有良好的识别效果,具有应用潜力。