基于相关滤波的视觉目标追踪研究

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:libq19811022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标追踪是计算机视觉重要研究领域之一,算法通过考察连续视频帧中目标的上下文信息,对被追踪目标的运动信息进行建模,然后基于所建立的模型对目标运动状态进行预测,并定位目标的位置。近年来,随着计算机技术、图像与视频处理技术及人工智能技术的迅速发展,视觉目标追踪广泛应用于智能视频监控、智能交通系统、智能视觉导航等领域,具有广阔的应用前景,已成为人们生活不可或缺的重要组成部分。基于相关滤波的追踪在速度和准确率上的性能取决于目标特征的表征,而深度神经网络具有强大的特征表征能力,所以将二者相互融合,并构建基于深度特征和相关滤波的位置、大小和角度的多模态追踪模型应该是视觉跟踪领域的发展趋势之一。本文针对基于相关滤波的视觉追踪算法、深度特征提取神经网络的学习方法以及基于深度特征和相关滤波的多模态追踪模型开展研究,主要工作如下:(1)基于经典的相关滤波追踪算法,一方面对追踪精度和速度二者之间的权衡策略展开研究,提出在保证追踪精度的前提条件下提高追踪速度的算法;另一方面,对具有旋转变化的追踪目标展开研究,提出了旋转目标追踪算法,并设计了基于手工特征提取的,能够同时追踪目标位置、大小、角度的实时追踪算法。进行了相关实验研究和结果分析。(2)在分析了基于相关滤波的无监督深度追踪网络(UDT)的局限性后,提出基于图割、全局对比度显著性检测和GrabCut的改进UDT特征提取网络的训练方法,能够从视频帧中自动地选择显著性目标区域,进行无监督特征网络训练;提出了降低基于图割、全局对比度显著性检测和GrabCut算法复杂度的方法,使其在无需人工参与情况下能够在一帧无标注视频图像中自动标注多个显著性目标,为无监督特征提取网络的进一步训练完善提供丰富的标签数据。对上述方法进行了相关实验研究和结果分析。(3)将上述(1)、(2)两部分内容进行高度融合,对基于深度网络和相关滤波的多模态追踪算法展开研究,设计并实现了基于深度网络和相关滤波的多模态(位置、尺度、角度)追踪集成算法;用(2)提出的自动标注方法构建了训练数据集,并在此数据集上进行了特征提取网络的训练;将追踪集成算法在OTB2015数据集上进行了相关的实验研究和结果比较分析。
其他文献
大数据时代,推荐系统是帮助人们解决信息爆炸问题最有效的工具之一,但传统的推荐系统往往面临着数据稀疏和冷启动两大问题。近年来,社交平台的快速发展,使得各应用平台都产生了丰富的社交信息,因此有学者提出社会化推荐系统,在推荐系统中引入社交关系来提高推荐效果。虽然目前已经有许多研究工作取得了不错的成果,但多数研究都基于显式社交关系,而显式社交关系往往存在数据稀疏和噪音问题。为了弥补显式社交关系的不足,本文
与资源丰富语言相比,资源稀缺语言命名实体识别面临的最大困难是训练模型所需的语料尤其是人工标注语料的获取难度大、成本高,如何以低成本、高效率地识别资源稀缺语言的命名实体是目前资源稀缺语言命名实体识别的研究重点之一。本文研究如何从与资源稀缺语言文本相关的图片中获取与人名实体相关的信息,并将其应用于资源稀缺语言的人名识别任务中。本论文以藏文人名识别为例,具体工作如下:首先从与文本相关图片中抽取图片中的重
与基于插值或者重建的机器学习方法相比,深度学习在超分辨率(Super-Resolution,SR)任务上显示出其独特的优势。然而,人工设计一个性能优秀的超分辨率网络往往需要耗费大量的人力物力。除此之外,随着人工设计的神经网络越来越复杂,想要人工设计出一个表现不错的神经网络成为一个挑战。为了减少人工设计神经网络所花费的人力物力,神经网络架构搜索(Neural Architecture Search,
近年来,随着人工智能技术的不断革新,国家对各行各业越来越注重信息化的投入。自然语言处理作为文本信息化的一种重要方式,将其与司法文书相结合使得司法办公自动化必将成为大势所趋。本文主要研究的民事案件法律文本中命名实体识别任务,是司法领域信息化的基础工作之一,对后续的司法案件信息提取、案情辅助研判等一系列应用具有促进作用。本文在基于民事案件法律文书的命名实体识别研究中,完成了以下工作:1)构建司法领域命
场景文本检测是指从图像中定位出文本位置,该技术在图像检索、机器人导航、工业自动化和实时翻译等场景中有广泛使用,具有非常广阔的研究与应用价值。自然场景中文本的大小、排列方向和对比度等有很大差异,而且还受到噪声干扰、拍摄角度和光照变化等因素的影响,受这些因素影响,传统的文本检测方法对场景文本的检测效果较差,无法适用于复杂的场景文本检测。随着深度学习的兴起,基于深度学习的场景文本检测方法取得了重大突破,
微课是指教师在教学过程中,围绕某一知识点精心设计的以视频为载体的教学活动,具有简短灵活、便捷共享的特点。《普通高中物理课程标准(2017版)》中强调深化信息技术在物理教学中的应用,促进信息技术与物理学科的融合,因此物理微课也越来越受到教育工作者们的关注。如何让微课设计更加合理、在保证科学性的基础上充分发挥其辅助作用成为了研究重点。本文引入美国学者凯勒提出的ARCS动机模型,以此模型为基础将对应动机
民族高等教育是我国高等教育的重要组成部分,肩负着传承民族文化、培养少数民族人才、促进民族地区发展等多重任务。教师是振兴教育的希望,当前民族高校青年教师是教学和科研的主体力量,但民族高校青年教师在专业发展的过程中受到多种压力和影响。因此,了解民族高校青年教师专业发展现状,探究民族高校青年教师专业发展的影响因素是促进其专业发展的前提。本研究是以民族高校青年教师作为研究对象,采用问卷调查法和访谈法在青年
随着互联网技术的迅速发展,互联网对于人们的生活、学习、工作等方方面面,越来越不可或缺。多文档自动文本摘要任务的目标是从多个文本中,总结提炼出用户最关注的信息,从而减少用户搜寻相关信息的时间,提高用户获取信息的效率。朝鲜族是我国56个民族之一,朝鲜语是我国具有文字的少数民族语言之一。我国一直致力于朝鲜语信息技术标准化的研究工作。中英文自动摘要任务目前已经取得了显著的成果,但目前国内朝鲜语自动文摘技术
在安静环境中,语音识别模型能够达到95%以上的准确率,然而在现实环境中使用还是会有诸多问题,比如环境噪音的干扰,远场麦克风采集的音频信息信噪比过低等问题,以至于音频信号不能够满足进行语音识别的要求。这时就需要其他模态信号对音频信号进行补充。与音频信号相比,视觉信息不易受到背景噪音的影响,在说话过程中,人的脸部各个器官也会随之做出相应的变化,恰好可以对音频信息做出一定的补充。根据目前已有资料,多模态
本文主要研究了连续最大流图像分割改进模型及模型的快速算法的数值实现.在图像分割中,通过CV模型进行图像分割,耗时长,迭代次数多,我们在研究CV模型的时候,采用对偶的思想将CV模型的原始能量泛函进行一系列的推导,简化得出连续最大流模型的能量泛函,然后给出了最大流模型在图论中的解释.连续最大流图像分割模型其分割结果易受参数和步长的影响,过分割会产生大量阶梯效应的伪影,而且纹理特征不明显.所以针对这种情