论文部分内容阅读
随着计算机视觉技术的快速发展,行人检测与跟踪技术已经普遍地应用于机器人、交通安全、视频监控等领域。在现实复杂背景下,行人检测与跟踪技术不可避免的会受到光线明暗变化、行人完全或部分遮挡、行人姿态等因素的影响。如何准确地检测出行人并实现快速的行人跟踪是研究的核心问题。本文主要是在实验室环境下,使用Nao机器人采集视频图像数据,在计算机上对相关的检测和跟踪算法进行改进和验证,并将改进后的算法应用到Nao机器人平台下,实现行人检测并完成头部跟踪行人的运动,满足了友好的人机交互需求。为了达到这一目标,本文的主要研究工作如下:在行人检测方面。第一,详细介绍了HOG特征算法的行人检测方法。然后选用INRIA行人数据集和实验室环境下的图像数据作为样本,并提取样本的HOG特征,生成HOG特征向量,将提取HOG特征后的图像数据投入到SVM分类器中进行训练,得到最终的检测子。最后通过Nao机器人拍摄的图像数据,作为待检样本进行检测,在图像中成功的将行人检测出来。第二,基于深度学习的YOLO网络模型结构,提出了改进的YOLO算法的快速行人检测方法。对YOLO网络模型结构改进并增加了损失函数,通过Nao机器人来采集行人图片,将采集到的图片划分成S×S个网络单元格,对于落入网络单元格中的行人进行检测,同时预测出具体属于哪一类,计算每个类在边框中的置信度分数。考虑到检测边框所带来的损失,改进后用边框的宽度和高度的平方根来代替。对于边框内的行人图像,增加损失函数,使检测效果进一步提升。第三,在同样的实验环境条件下,将改进的YOLO检测算法与HOG特征算法作对比实验分析。在行人跟踪方面。基于MeanShift行人跟踪算法,在没有障碍物实验室环境下,使用Nao机器人来采集视频图像数据,选定所要跟踪的行人,根据直方图信息让MeanShift算法不断迭代,来达到跟踪的目的。但存在算法执行速度慢和搜索框不能适应摄像头和跟踪目标距离变化的问题。采用Kalman滤波改进的Camshift算法,可以自适应搜索窗口的大小,通过预测下一帧行人的具体位置,解决了存在障碍物时行人跟踪丢失的问题,但也存在算法执行速度慢的问题。另外采用KCF行人跟踪算法,在有障碍物存在的情况下,针对单人或多人来完成跟踪实验,有效地提高了行人跟踪的准确性和快速性。从精确度和快速性角度,做对比实验并分析行人跟踪算法。在Nao机器人平台下,采用改进的YOLO模型检测算法来检测行人,使用KCF行人跟踪算法来实现Nao机器人头部跟踪行人的物理实验。