多目标自动检测跟踪识别算法研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:sanhaijin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用无人机平台进行实时多目标跟踪是无人机研究中很有实用意义的研究方向之一,同时它也面临不少挑战。目前主流的多目标跟踪算法都是用的以检测来跟踪(Tracking by Detection,TBD)的范式,即用目标检测网络找到待跟踪目标,再对目标进行跟踪。无人机获取图像时所处的位置往往离地面较远,因此图像中的目标通常尺寸较小且密集,非常考验算法中目标检测的精准度。同时,实时跟踪算法看重实时性,因此需要算法同时保证运行速度。又由于搭载平台的限制,也希望算法的运算量能尽量小。本论文提出基于改进的YOLOv4目标检测算法,并将其与TBD的多目标跟踪算法相结合,以期能满足上述要求。具体的工作有:(1)提出改进的目标检测算法。在SOTA(state-of-the-art)的目标检测算法YOLOv4的基础上,对其在骨干网络、检测颈、检测头以及数据增强方式上进行了改进。具体的优化措施有:在v4网络输入端加入Focus结构,以保留输入图像更多的细节特征;把骨干网络中的残差结构替换成Dense结构,在减少网络的参数的同时提升网络性能;在检测颈中加入CSP结构,使特征融合得更好;在测试时使用图像自适应缩放,加快测试图像时的推理速度。改进后的算法为CSPDense YOLO算法。设计了实验,在Vis Drone2019目标检测数据集上将该算法与YOLOv4算法的性能进行对比,实验结果表明提出的CSPDense YOLO算法在无人机目标检测数据集上的m AP比YOLOv4的提高了6.1%,FPS提高了6.2%。(2)提出改进的多目标跟踪算法。以Deep SORT算法为蓝本,将其算法中的特征提取网络替换为更快、更精确的CSPDense YOLO目标检测网络,并针对多目标跟踪任务的需求将网络的检测头进行修改,使网络输出检测目标的位置、分类和外观特征。输出的目标位置信息用于运动目标建模,从而计算检测目标与已跟踪目标的运动特征相似度;输出的外观特征,也即embedding信息用于计算目标与已跟踪目标的外观相似度;再将两个相似度融合得到特征融合相似度。然后使用级联匹配算法缓解跟踪的ID切换现象。设计了实验,在Vis Drone219多目标跟踪数据集上将改进后的算法的性能进行对比,实验结果表明提出的算法相比Deep SORT的MOTA提高了10.1%,MOTP提高了10.3%,ID切换次数下降了24.5%,FPS提高了52.1%。(3)将算法集成在NVIDIA Jestson TX2平台上,并使用Tensor RT对所提出的CSPDense YOLO算法进行了优化加速。然后在该平台对该算法进行了测试,算法的FPS高达24.2帧/秒;又在无人机平台上对该算法进行了实测,实测结果证明了算法在无人机平台上的性能足以满足实用需求。
其他文献
新时代科技的发展尤其是互联网技术的普及使得教育教学的方式和环境都产生了翻天覆地的变化,其主要表现为知识传播形式的革新和信息量的暴增,网络教学系统层出不穷。截至目前,网络教学系统多采用基础B/S架构。然而由于依托于浏览器,这些系统难以针对用户特点和习惯实现个性化功能,只能以统一、公用的平台进行教育教学;另一方面,B/S架构的网络教学系统对课程运营者服务端有较高的性能要求,其开销也极大地限制了网络教学
随着近年来我国创新驱动发展战略的实施,航空航天作为国家的重点产业也在飞速发展着。复合材料在航空航天行业的生产中起着无可替代的作用,现有的复合材料管理方式以纸质材料和电子表格为主,这种方式不仅无法使材料管理人员实时掌握材料状态和用量,而且极易造成材料的浪费与报废,尤其是对于复合材料中的易变质材料。现代先进航天器与大飞机的生产对这部分易变质材料的管理提出了更高的要求,因此有必要探索新的管理方式。本文对
设计更改是设计单位根据客户、工程需要或者修订发现错误时对原设计文件进行调整,是制造企业科研生产经营活动中一项非常常见和重要的工作。随着企业不断发展壮大,数字化制造等技术的不断应用,产品创新和改善的频次越来越高,同时客户化定制、敏捷制造的流行,传统的纸质管理方式已越来越无法跟上转变的步伐,使公司在管理设计更改时浪费大量的人力物力。不少企业已建立起以PDM、ERP和MES等系统为基础的先进数字化管理体
为了满足航空数控产品高质量的要求,国外洛·马、波音、空客等行业巨头已开发集成的质量管理系统并投入现场使用,这些行业巨头借助于设计系统、制造资源系统、财务系统等,开展了全面的质量信息化管理。而目前在公司内部,作为质量控制的重要环节,质量数据统计、上报仍然依赖传统单机Excel的形式,检验数据离散的分布在生产制造流程的各个环节,部分记录仍以纸质载体为主,且最终统计结果数据存储于统计人员的本机上,无法与
中国电信某省分公司CRM系统为千万数量级用户提供了电信通信商品销售、售后、自助受理等信息化服务。随着移动互联网、手机及宽带业务发展,CRM系统应用的功能越来越丰富,业务的逻辑规则也越来越复杂。为了更加有效地解决业务高峰期服务响应缓慢、数据库连接数量激增等问题,CRM系统开始向着基于分布式服务的互联网架构进行转型。随着CRM 3.0的“云+平台+应用”的架构改造工作开展,系统原有的数据交互方式也不再
近年来,计算机视觉领域受到越来越广泛的关注。图像作为人类沟通的重要媒介之一,在现实世界中具有许多重要的应用场景,如图像识别、图像生成、图像翻译等等。其中,图像翻译为该领域的研究热点。类似于语言翻译,图像翻译是指将图像从一个域的特征转换为另一个域的特征。随着近几年深度学习技术的发展,图像翻译领域的研究除了起初的图像风格迁移、黑白照转换、图像超分辨率提高、人脸动漫化以外,还包括图像实例级转换。虽然现有
本文以中英文文本及数学表达式混合的扫描或拍照图像作为研究对象,提出了一个高效的印刷体文本公式混合识别算法,并设计和实现了一个相应的系统。主要研究内容如下:1.融合目标检测及传统方法的题块结构分析算法。对题块图像做预处理,并融合目标检测技术及传统图像处理方法,将题块图像中的文本行及题目配图准确地定位和切分出来。2.融合表达式向量的文本及数学公式混合图像内容检测算法。针对数学表达式与中英文文本混合识别
比特币上的用户是高度匿名化的,这也滋生出许多经由比特币的违法行为,例如暗网,洗钱等等。考虑到这些违法行为在比特币交易行为上会体现某一些特征,所以本文考虑从交易行为的角度对比特币上的数据进行分析,从而实现一定程度上的去匿名化,这可以为监管机构和执法部门在对比特币上的违法交易做检测和取证时提供帮助。传统方法对比特币上的交易行为分析主要是通过启发式方法合并实体,借由实体来分析其共性,或者通过特征工程,再
目标检测算法是自动驾驶环境感知的关键技术之一。算法的复杂度特性和参数规模,使得车载计算平台的算力和功耗面临挑战。如何设计符合硬件特性要求的轻量化神经网络,是当前自动驾驶感知系统面临的难题。为此,本文综合考虑算法与硬件特性,基于FPGA车载计算平台实现了目标检测算法的设计与优化。在FPGA低功耗的前提下,针对当前算法与硬件设计割裂的问题,本文提出软硬件联合学习方法,设计了符合硬件特性的轻量化骨干网络
大数据蕴含有海量信息,地理文本大数据是大数据的重要组成部分,也是构建地理知识图谱的重要数据,但是这些数据中含有大量无用信息,如何从这些数据中过滤出有价值的数据是人们亟需解决的问题。地理知识图谱能够帮助学者们解决这一问题,而实体关系抽取是构建知识图谱的重要任务之一。实体关系抽取大多是运用深度学习的方法完成,但是地理领域的标注语料库非常稀缺,人工标注数据又费时费力,导致难以使用有监督的方法进行抽取,并