论文部分内容阅读
在当今人工智能与大数据驱动下的智能计算机行业中,图像处理与模式识别逐渐成为学者专家研究的重点。目标检测与定位在安防视频监控中起着非常重要的作用,同时在工业检测也有广泛的应用。随着研究的不断深入,需更精确的分析视频中人体的动作行为,故动作识别也逐渐成为计算视觉研究领域的重要方向,在人机交互、智能监控领域中,可预见的应用前景十分可观。本文在仔细研究阅读大量国内外参考文献基础上,总结了学者前辈研究工作的优缺点,并对针对舞台这一特定场景,对人体运动目标实时检测定位和动作识别等关键技术进行深入的研究。在目标检测中,分析了几种深度学习的目标检测方法,针对本文研究场景,采用SSD(Single Shot MultiBox Detector)目标检测方法。通过数据增强、特征优化以及迁移学习对本文的检测模型进行调优,提高检测精度,实现对目标的实时检测,并通过自己设计视觉标定物,来实现多人身份的唯一性检测;在双目视觉定位中,相机标定采用棋盘格标定法,利用Matlab相机标定工具箱进行标定,以及通过自定义世界坐标与图像坐标中对应点求解相机的内参和外参,最后利用极线几何约束关系对目标进行定位。在检测定位实验中,实现40fps检测速度,且平均定位误差在10cm以内。在动作识别中,本文提出了一种基于多项式拟合的模特走秀动作评价方法。首先采用基于局部亲和域的方法对人体关节点进行检测,同时为消除相机位姿和个体体型的差异,可将检测的关节点利用普氏分析进行数据校准;其次将人体关节点分为脊柱、上肢和下肢三部分进行分析,分别从水平方向和竖直方向进行多项式拟合;然后将多项式拟合系数进行PCA数据降维;最后将降维后的系数作为动作分析评价的特征,利用SVM分类器实现对模特走秀动作的分类识别。该方法通过交叉验证的准确率为71.9%,初步实现了对模特走秀动作的专业性评价。