基于深度卷积神经网络的车辆检测算法研究

来源 :湖南师范大学 | 被引量 : 1次 | 上传用户:javaname41
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,自动驾驶研究、智慧交通建设突飞猛进,车辆检测技术成为业界的研究热点。由于深度卷积神经网络具有一定的旋转与平移不变性等特点,在车辆检测任务中得到广泛应用,其中,YOLOv3(You Only Look Once version 3)算法是目前主要的检测算法之一。然而,在车辆检测应用中,YOLOv3算法存在以下问题:(1)YOLOv3的先验检测框生成机制没有考虑到不同种类车辆在尺寸上的显著差异,导致先验检测框不能较好地契合真实目标大小,降低了检测精度;(2)随着网络的加深,YOLOv3算法的特征提取网络会产生一定程度的信息丢失,影响深层网络检测精度;(3)YOLOv3算法深层的检测特征图感受野偏小,不利于中大尺寸目标的精确检测。针对以上问题,本文提出了一种改进的基于YOLOv3的车辆检测算法IAVD-YOLOv3(Improved Algorithm for Vehicle Detection based on YOLOv3),在保证实时性的前提下,有效提升了车辆检测精度。论文的主要工作如下:(1)首先,提出了一种新的先验检测框尺寸生成策略。该策略使用K-means++算法对真实目标框尺寸聚类,并以平方欧氏距离作为样本间的距离度量标准,克服了原有方法聚类结果不稳定、易陷入局部最小值的问题,同时增强了不同种类车辆之间的区分度,提升了检测精度。然后,针对车辆检测任务中微小目标少、中大型目标多的情况,通过增大最深层特征图的等效采样步长,扩大网络的有效感受野,使网络能从更大范围内提取特征,以适应数据集中的大尺寸目标。接着,针对原始YOLOv3特征提取网络信息丢失的问题,借鉴Dense Net的思想,设计新的特征提取网络,在网络中增加密集模块和过渡模块,使浅层特征能够更充分地传递到网络深层。最后,重新设计了五个检测层,五个检测层共同构成特征金字塔执行车辆检测任务,增强了对于车辆目标尤其是中大尺寸车辆目标的检测能力。(2)基于GTX1080Ti显卡,使用KITTI自动驾驶数据集和自制车辆检测数据集,采用平均精度、每秒检测帧数作为评价指标,将本文算法与YOLOv3、SSD、Faster-RCNN进行对比实验。首先,基于KITTI数据集,验证本文的先验检测框聚类方式对车辆检测算法精度的影响。接着,将本文算法与上述三个算法进行对比实验,从平均精度和运行速度两个方面,对KITTI数据集中的图片进行检测评价。最后,使用自制的车辆检测数据集,对本文算法进行评测。实验证明,在保证车辆检测实时性的前提下,IAVD-YOLOv3算法的平均精度(mAP)高于YOLOv3、SSD算法,与不满足实时性要求的Faster-RCNN算法相接近,并能较好地适应新场景下的车辆检测任务。
其他文献
近年来中国的市场经济建设取得了良好的成绩,人民的物质生活水平不断提高。在这种时代背景下,不同经济主体之间的贸易往来日渐频繁,彼此间的法律关系逐渐复杂,矛盾纠纷的产生
本文针对转向架轴距尺寸与平行度三维检测的关键技术,设计并构建了列车转向架轴距尺寸与平行度测量系统,开展了线结构光标定技术、列车转向架轮对三维重构技术、列车转向架轴
近年来随着科学技术的快速进步,有机电子学也得到了迅速发展。而且由于有机电子器件与传统无机器件相比,尤其在材料的获取、工业生产过程以及实际应用等方面有着独特的性能,
飞机起落架是一种用于起降、滑跑的装置,它在整个飞机中占有重要的位置。然而飞机起落架中的防扭臂结构极易在飞机降落过程中发生破坏,故对防扭臂结构进行优化设计极其重要。国内外学者主要是对防扭臂结构进行尺寸优化设计,很少有学者对其进行拓扑优化设计,即使有学者对其进行拓扑优化设计,也只是通过理论计算获得工况条件或利用前人得到的试验数据作为工况条件,很少有学者利用虚拟样机技术(ADAMS)对整个起落架进行落震
学位
随着产业技术升级,智能安防监控、图像采集、目标识别与追踪等设备在粮库安全保障中得到大面积推广。安防视频监控系统能够对粮库主要的进出口储粮通道、库区、作业点、器械
并联管路流量分配不均匀问题广泛存在于油田油气集输系统中,转油站来流系统来流的不确定性导致并联管路“偏流”工况的产生,来流在管道中的相态和流态随压力和管道形态的不同
近年来,随着深度学习在计算机视觉领域取得了极大的成功,基于深度学习的智慧监控系统研究也获得研究人员的广泛关注。行人再识别问题作为智慧监控系统的重要组成部分,在寻找
本文研究磁性材料铁磁链模型及其相关模型解的问题,铁磁链方程中最重要的方程就是LL方程,他是描述铁磁性材料磁密度演化的基础方程.在文章中我们构造了具有有理分数形式的薛
无标定视觉伺服根据目标特征在图像空间内的误差信息,通过视觉映射模型将平面图像误差映射到三维空间,引导机械臂实现空间定位。无标定视觉伺服在不确定的工作场景和执行较为
白光发光二极管为固态照明领域提供了新的环保机遇,大大降低了全球能源消耗和二氧化碳气体排放。另外,它们还展现出低成本,易于微调,可加工性,低毒性,设备制造有足够的灵活性