论文部分内容阅读
近年来,自动驾驶研究、智慧交通建设突飞猛进,车辆检测技术成为业界的研究热点。由于深度卷积神经网络具有一定的旋转与平移不变性等特点,在车辆检测任务中得到广泛应用,其中,YOLOv3(You Only Look Once version 3)算法是目前主要的检测算法之一。然而,在车辆检测应用中,YOLOv3算法存在以下问题:(1)YOLOv3的先验检测框生成机制没有考虑到不同种类车辆在尺寸上的显著差异,导致先验检测框不能较好地契合真实目标大小,降低了检测精度;(2)随着网络的加深,YOLOv3算法的特征提取网络会产生一定程度的信息丢失,影响深层网络检测精度;(3)YOLOv3算法深层的检测特征图感受野偏小,不利于中大尺寸目标的精确检测。针对以上问题,本文提出了一种改进的基于YOLOv3的车辆检测算法IAVD-YOLOv3(Improved Algorithm for Vehicle Detection based on YOLOv3),在保证实时性的前提下,有效提升了车辆检测精度。论文的主要工作如下:(1)首先,提出了一种新的先验检测框尺寸生成策略。该策略使用K-means++算法对真实目标框尺寸聚类,并以平方欧氏距离作为样本间的距离度量标准,克服了原有方法聚类结果不稳定、易陷入局部最小值的问题,同时增强了不同种类车辆之间的区分度,提升了检测精度。然后,针对车辆检测任务中微小目标少、中大型目标多的情况,通过增大最深层特征图的等效采样步长,扩大网络的有效感受野,使网络能从更大范围内提取特征,以适应数据集中的大尺寸目标。接着,针对原始YOLOv3特征提取网络信息丢失的问题,借鉴Dense Net的思想,设计新的特征提取网络,在网络中增加密集模块和过渡模块,使浅层特征能够更充分地传递到网络深层。最后,重新设计了五个检测层,五个检测层共同构成特征金字塔执行车辆检测任务,增强了对于车辆目标尤其是中大尺寸车辆目标的检测能力。(2)基于GTX1080Ti显卡,使用KITTI自动驾驶数据集和自制车辆检测数据集,采用平均精度、每秒检测帧数作为评价指标,将本文算法与YOLOv3、SSD、Faster-RCNN进行对比实验。首先,基于KITTI数据集,验证本文的先验检测框聚类方式对车辆检测算法精度的影响。接着,将本文算法与上述三个算法进行对比实验,从平均精度和运行速度两个方面,对KITTI数据集中的图片进行检测评价。最后,使用自制的车辆检测数据集,对本文算法进行评测。实验证明,在保证车辆检测实时性的前提下,IAVD-YOLOv3算法的平均精度(mAP)高于YOLOv3、SSD算法,与不满足实时性要求的Faster-RCNN算法相接近,并能较好地适应新场景下的车辆检测任务。