视频多目标检测与跟踪算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:hitiger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多目标检测与跟踪作为计算机视觉的重要组成部分,在智能监控、人机交互、无人驾驶、视频会议、医疗图像分析等领域有着广泛的应用。目标检测的目的是从待测图像中提取出感兴趣的目标窗口,而多目标跟踪通常作为目标检测后续步骤,将不同帧的多个目标进行区分和关联,得到每个目标的运动模型和历史轨迹。由于视频场景的复杂性和目标状态的不可预知性,多目标检测和跟踪中仍然存在很多问题尚未完全解决,需要进一步研究和改善。  本文的研究工作围绕目标检测和多目标跟踪两方面分别展开,主要工作和贡献如下:  1.在目标检测领域,提出了一种基于聚合通道特征(Aggregated Channel Features,ACF)和视觉背景提取(Visual Background Extractor, VIBE)的目标检测方法。针对ACF目标检测结果中因背景干扰造成误检过多的问题,首先获得ACF的检测结果作为候选窗口,并利用VIBE方法检测出视频图像的运动前景,然后计算候选窗口与运动前景的相交比值,再加上候选窗口的检测得分送入逻辑回归分类器进行决策,最终确定目标的检测窗口。实验结果表明,提出的方法能够有效滤除因背景干扰造成的误检,在综合的评估指标ROC曲线上相比原始的ACF方法取得了更好的效果。  2.在多目标跟踪领域,提出了一种基于参数学习和运动预测的在线多目标跟踪算法。针对视频中的短时遮挡和检测器误差造成的误检和漏检问题,采用逐帧关联的方式,首先利用目标的历史轨迹建立卡尔曼滤波器模型预测目标当前帧的可能位置,然后计算目标和当前帧观测之间的关联度来建立代价矩阵。而多目标跟踪被建模成指派问题,并采用Hungarain算法求解。对于多目标跟踪系统中的参数,设计了一种基于支撑向量机的二分类训练方案。公开数据集上的实验结果验证了参数学习的有效性以及对误检、漏检和遮挡的鲁棒性,并且在与若干经典算法的比较中,提出的算法在平均正确率和误检数两个指标上表现出一定优势。
其他文献
听觉流的知觉成组是听觉场景分析中的基础研究内容之一,从中获得的听觉感知规律及认知机制对于更好地理解鸡尾酒会问题有重要的意义,同时也为建立基于听觉认知原理的智能化语音
  本文介绍了一种基于小波变换的适于噪声信道的数字图象压缩传输算法。这是一种基于SPIHT算法的信源信道混合编码算法,利用而不是改变嵌入式码流的特点,以灵活多变的方式在
SAR系统的分辨特性是一项重要的性能指标,一方面标志着系统所具有的性能,反映雷达获取信息的技术能力;另一方面也是SAR系统应用的前提和基础。传统的SAR分辨特性评价指标主要通
随着三网融合的不断推进,广播电视网和电视相关产业蓬勃发展,搭载了智能电视操作系统的智能电视,作为内容与服务呈现的载体,成为产业链中的核心环节。多任务运行是智能电视操作系
干涉合成孔径雷达(Interferometric Synthetic Aperture Radar,InSAR)技术通过利用两幅或两幅以上的SAR复图像提取出干涉相位,从而获得地表高程信息,是对传统SAR技术的一种拓展
座落在武昌蛇山南麓的湖北省图书馆始建于1904年,是我国最早建立的省级公共图书馆之一,今年的8月27日,她迎来了自己的105华诞.这座被誉为“楚天智海”的百年老馆,前半个世纪
太空碎片问题已成为人类航天活动不可忽视的一部分。随着人类第一次打开太空之门,源源不断的向太空输送各种太空碎片,到目前为止,各种碎片已超过1亿件。人类急需携起手来共同治
WCDMA系统是第三代移动通信系统的实现方案之一.该文在介绍WCDMA系统的无线传输技术部分结构和参数之后,着重研究了该系统下行链路小区搜索和RAKE接收机的设计.该文首先介绍
该论文首先概述了移动衰落信道的特点,又介绍了数字通信中几种常用的调制技术和几种经典的信道纠错码,在此基础上,详细讨论了不展宽频带的高效编码调制方案的一个分支--多级
水下滑翔机是一种基于滑翔原理的依靠内置执行机构调整重心位置和净浮力来控制其自身运动状态的新型水下自治机器人,它利用水平升降翼在有攻角情况下产生的前进动力,进行锯齿形