论文部分内容阅读
现在,视频识别作为一种高科技新兴产物,已经越来越受到人们的关注。而作为视频识别的一部分,关于视频和图像方面的人机交互,视频监控,以及运动分析的研究是最近各家大公司热门的研究方向,具有很大的发展前景。但是现在很多关于视频识别的研究,都是运用在电脑上做的,而手机作为人们经常使用的拍摄设备,普及率非常高,但是用在手机方面的视频识别研究却很少,而手机方面的视频识别和电脑方面的视频识别是有很大的不同的,主要体现在手机所拍摄的视频比电脑拍摄的视频抖动要大,噪音要多等问题。故而本文对这些问题进行了相应的探讨,希望通过对手机摄像头所拍摄的视频进行研究,旨在搭建一个能够通过手机摄像头拍摄的视频进行相应动作识别的系统。为了搭建上述的系统,本文主要做了如下方面的研究工作。在通过视频获取前景图片的这方面,本文基于手机拍摄的视频容易受到噪声干扰以及背景图像不是完全静止的特点,通过对3种提取前景的方法做相应的实验分析,计算得到相应前景提取方法的查准率,最后通过对这几种前景提取方法的查准率进行对比,确定了以高斯混合模型作为前景提取方法的方案。在相应目标动作特征提取和处理的方面,本文基于所获得的前景图有相应噪声、目标动作视频长度,帧数目长度不一、所获得的数据有相应的“奇异点”的这几个特点,对提取的前景图片做了相应的连通域处理,重采样,“奇异点”处理等操作。在通过特征数据训练模型的这方面,本文通过对随机森林、迭代决策树(Iterative Decision Tree,GBDT)、支持向量机这3种方法进行实验对比,并且通过OPENCV搭建了一个实验平台验证,利用这个平台对我们500多组视频3个动作进行识别研究分析。以3:7的比例填充测试样本进行测试,其中比例3的意思是这部分样本跟训练样本是相关的,比例7的意思是这部分样本跟训练样本是完全不相关的。通过计算出用户对我们识别效果的满意度,比较几种机器学习方法的满意度,得到相应的最优算法。并通过对相应算法的改进,得到我们系统的总体框架。最后得出,通过高斯混合模型和GBDT相结合的识别效果最好,识别率达到95%以上。综上所述,最终确定了本文所做系统的整体方案。