论文部分内容阅读
智能交通系统作为智慧城市的重要组成部分,对缓解现代城市当中的交通拥堵状况和提高通行效率有着非常积极的推进作用。随着技术的发展和硬件设备的提高,目前的智能交通系统越来越依赖于来自于不同传感器的数据,其中基于计算机视觉的视频监控系统更是被广泛的应用于智能交通分析中。分析交通场景中的交通拥挤程度对于交管部门重新规划车辆行驶路线和减少拥堵是十分重要的;同时,车辆检测是许多交通监控系统(如车辆计数、跟踪和检索等)的关键基础步骤。目前的针对交通场景的分析主要采用的是背景建模、光流、动态纹理等方法;车辆的检测算法以基于人工特征的方法为主,主要处理小规模的交通卡口摄像头的监控数据。当前,交通视频分析领域存在的挑战主要有:(1)公开的交通数据相对较少;(2)低帧率、低分辨率的视频监控数据占有一定的比例;(3)摄像头和车辆的相对位置引起的遮挡、形状和姿态变化;(4)不同天气和光照条件的变化。本文结合目前深度学习技术在智能交通监控领域的发展,针对当前低帧率视频智能交通分析的主要挑战,从宏观分析交通图片的拥挤密度和微观检测分类图像中的车辆两个方面展开工作,力求为低帧率视频智能交通分析提供理论参考和工程借鉴。本文的研究工作主要包括以下三方面:1.针对低帧率的远距离拍摄的视频存在的问题(例如无法计算运动特征、车辆尺度小和遮挡严重等),提出了基于卷积神经网络(Convolutional Neural Networks(CNN))的交通密度估计模型,从整体上预测道路中车辆的拥挤情况。本文作者以往的工作[1]验证了交通状态与图像纹理特征是密切相关的,并且CNN能够有效的学习和提取有判别力的纹理特征。因此,本文直接采用多个CNN模型将交通图片分割到三个不同的语义类别(道路(road)、车辆(car)、背景(background)),并分类图片中的场景到不同的拥挤程度(empty,fluid,heavy,jam)以及预测相应的交通密度。同时为了使某一特定数据集下训练得到的模型可以较好地泛化用于分析新的交通场景,本文提出了一种迁移学习框架,使得CNN模型具有场景自适应能力。2.针对目前视频监控领域公开数据集匮乏的问题,本文构建并公开了目前最大规模的用于车辆的检测与分类交通监控数据库,并在该数据库上对比分析了多种主流的深度学习算法。随着深度学习的飞速发展,深度学习模型越来越复杂。为避免模型过拟合,带有标记信息的训练数据至关重要。大型交通视频公开数据集的匮乏制约深度学习技术在智能交通分析领域的深入研究与应用。鉴于大规模数据库在深度学习领域的重要性以及智能交通分析离不开数据的支撑,本文与加拿大Miovision公司合作,构建和公开了目前全球最大规模的监控摄像头下的车辆检测和分类的数据库(MIOvision Traffic Camera Dataset(MIO-TCD))。基于 MIO-TCD数据库,本文构建了相应的在线评测平台,并组织了 2017年CVPR会议的Traffic Surveillance Workshop and Challenge,并评测了多种主流深度学习算法在车辆分类和检测上的表现。实验结果显示,目前的深度学习方法己经能够精确地从单帧图片中检测和识别车辆。通过对实验结果进行更进一步的对比分析后,目前的方法存在不足的地方,本文也并给出了一些潜在的研究方向。3.为快速定位图像中的感兴趣区域(例如:交通场景中的车辆),同时保证算法的精确性和鲁棒性,本文构建了一套基于多尺度CNN的显著性检测模型(NLDF)。视觉显著性检测的主要目的是从图片中找出最重要的目标,受Mumford-Shah图像分割模型[2]的启发,在MS模型的基础上提出了一个多尺度的4×5的网格CNN模型(NLDF)用于检测显著性目标。该模型可以有效地融合局部及全局的特征,并通过一个新提出的惩罚边缘的非重叠率损失函数进行训练。在多个显著性评价基准数据上的实验结果显示,该模型可以进行高效的、高精度的显著性检测。最后,我们将这个模型用于交通分析(车辆前景分割),并通过在MIO-TCD数据集进行训练和测试,结果显示该模型能够精确的分割和定位出交通场景中的车辆;在多个不同的交通视频上进行了泛化测试,结果显示在MIO-TCD数据库上训练得到的车辆分割模型具有很好的泛化能力。综上所述,基于CNN的模型可以在不依赖于运动特征的情况下分析交通场景的拥挤程度;同时在大规模数据库上训练得到的深度模型可以有效的进行车辆的检测和分类并具有很好的泛化能力。