论文部分内容阅读
多目标检测与跟踪作为计算机视觉的重要组成部分,在智能监控、人机交互、无人驾驶、视频会议、医疗图像分析等领域有着广泛的应用。目标检测的目的是从待测图像中提取出感兴趣的目标窗口,而多目标跟踪通常作为目标检测后续步骤,将不同帧的多个目标进行区分和关联,得到每个目标的运动模型和历史轨迹。由于视频场景的复杂性和目标状态的不可预知性,多目标检测和跟踪中仍然存在很多问题尚未完全解决,需要进一步研究和改善。 本文的研究工作围绕目标检测和多目标跟踪两方面分别展开,主要工作和贡献如下: 1.在目标检测领域,提出了一种基于聚合通道特征(Aggregated Channel Features,ACF)和视觉背景提取(Visual Background Extractor, VIBE)的目标检测方法。针对ACF目标检测结果中因背景干扰造成误检过多的问题,首先获得ACF的检测结果作为候选窗口,并利用VIBE方法检测出视频图像的运动前景,然后计算候选窗口与运动前景的相交比值,再加上候选窗口的检测得分送入逻辑回归分类器进行决策,最终确定目标的检测窗口。实验结果表明,提出的方法能够有效滤除因背景干扰造成的误检,在综合的评估指标ROC曲线上相比原始的ACF方法取得了更好的效果。 2.在多目标跟踪领域,提出了一种基于参数学习和运动预测的在线多目标跟踪算法。针对视频中的短时遮挡和检测器误差造成的误检和漏检问题,采用逐帧关联的方式,首先利用目标的历史轨迹建立卡尔曼滤波器模型预测目标当前帧的可能位置,然后计算目标和当前帧观测之间的关联度来建立代价矩阵。而多目标跟踪被建模成指派问题,并采用Hungarain算法求解。对于多目标跟踪系统中的参数,设计了一种基于支撑向量机的二分类训练方案。公开数据集上的实验结果验证了参数学习的有效性以及对误检、漏检和遮挡的鲁棒性,并且在与若干经典算法的比较中,提出的算法在平均正确率和误检数两个指标上表现出一定优势。