交通场景下基于深度学习的目标检测和图像分割研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lala_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断进步,基于深度学习的人工智能技术高速发展,已经被广泛应用在交通场景下。尤其在智能交通系统和自动驾驶场景中,通过使用目标检测算法对采集到的视频进行检测,不仅可以获取车辆、行人的基本信息,还可获取相应的流量信息,并预测其运动趋势。除此之外,我们还需对周围环境做出准确感知,因此通过图像分割技术来从道路图像中获取周围环境信息,从而区分行人、车辆、障碍物、车道线和可行驶区域等重要交通信息。传统目标检测和图像分割方法需要手工设计特征,这严重影响了检测和分割的性能。基于深度学习的目标检测和图像分割方法通过加深神经网络的层次来提取更丰富的特征信息,可显著提升检测和分割的性能。在交通场景中,作为最重要的目标之一,车辆由于其自身和环境特点,导致检测网络的特征提取难度大,往往出现漏检、误检、检测精度不高等问题。而在图像分割方面,当前流行的方法通常在速度和精度上难以兼顾,无法满足交通场景的实时性要求。本文针对交通场景下基于深度学习的车辆检测和图像分割技术分别进行了深入研究,在已有的比较成熟的深度学习网络的基础上,提出了有效的改进方法,具体的研究工作如下:(1)提出了一种基于改进YOLOv4的车辆检测算法。针对YOLOv4目标检测算法在检测车辆时特征提取不够充分的问题,通过引入ECA注意力机制、高分辨率网络HRNet等对YOLOv4目标检测网络进行了改进,显著提高了网络的特征提取能力。实验结果表明,本文所提出的改进方法有效改善了YOLOv4在车辆检测时的漏检、误检问题,提高了检测精度,与此同时保证了检测的实时性。(2)提出了一种基于改进Deep Labv3+的交通场景图像分割算法。在交通场景图像分割任务中,针对传统池化操作造成的图像信息丢失过多的问题,使用Soft Pool池化方法替换原有的池化操作。此外,针对图像分割算法运行速度较慢,无法满足实时分割要求的问题,使用Mobile Net V2作为Deep Labv3+网络的主干特征提取网络。实验结果表明,本文所提出方法在提升了图像分割精度的同时保证了分割速度,有效提升了分割效果。
其他文献
学位
嵌入式Flash存储器是一种广泛应用的非易失存储器,很多MCU以及IoT芯片都在内部集成了Flash。Flash作为Memory的一种类型,其无需电源即可保持数据,与传统硬盘相比传输速度更快、功耗更低、体积小、不易损坏、且价格更低,已经被广泛使用作为SOC芯片中的存储器件。由于嵌入式Flash的接口协议不同于标准AMBA总线接口,为了将其集成到SOC中,需要设计控制器实现两种协议的转换,完成Fla
随着半导体技术的高速发展,模数转换器(ADC)作为通信、视频传输等领域的重要组成部分,ADC的精度、速度要求也随现今的发展有着更为严苛的规定。在众多的ADC结构里,算法ADC具备着高精度、低功耗、低成本的设计优势。因此本文针对高精度低功耗算法ADC进行了相关的研究。论文首先介绍了本课题的研究背景以及意义,并对算法ADC的基本特性进行了分析;其次对传统的算法ADC进行了改进,使用了冗余符号位编码(R
超高清视频是继视频数字化、高清化之后的新一轮重大技术革新,将带动产业链各环节发生深刻变革。但超高清视频数据量巨大,导致对其传输、存储和处理压力巨大。在带宽有限的情况下,视频传输帧率往往为30 Hz或者60 Hz。但由于播放设备往往存在差异,主流显示设备的刷新率一般为60 Hz,少数高端产品会有刷新率更高的屏幕。由于片源和屏幕之间的刷新率存在差异,会出现例如拖影、停顿、模糊等现象,使得我们观看的视频
二氧化钛(TiO2)是一种非常重要的宽禁带(~3.0-3.2 e V)半导体材料,由于其经济无毒且具有物理化学性质稳定的特点,而被广泛应用于紫外探测、光催化和环境能源再生及保护等各个领域。但由于TiO2对可见光吸收有限且其性能受形貌及晶型影响较大,严重阻碍了TiO2在各领域的应用。近年来,为提高TiO2对整个太阳光波段的光谱吸收,科研工作者主要采用以下三种方式提高其性能,(1)控制形貌:低维纳米线
Al Ga N/Ga N异质结具有很强的自发和压电极化效应,即使在没有任何掺杂情况下,只有极化应力也能在Al Ga N/Ga N异质结界面的量子阱中产生高密度的二维电子气体。Al Ga N/Ga N HEMT在高频电子器件和高功率中具有很大应用潜力。然而,在高功率器件应用中,Al Ga N/Ga N HEMT的结温持续升高成为制约其进一步发展的瓶颈。传统衬底上的Al Ga N/Ga N HEMT具
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种成像分辨率高、全天时、全天候、作用距离远的微波成像系统,凭借其诸多优点合成孔径雷达在军用和民用领域发挥着巨大作用。在追求合成孔径雷达技术应用能力不断提高的大环境下,合成孔径雷达工作模式目前已经发展出条带模式、聚束模式、滑动聚束模式、扫描模式、循序扫描地形观测等工作模式。滑动聚束模式既解决了条带模式下方位向分辨率受限问题,
高维数据集引起的“维数灾难”问题不仅增加了计算内存和运行时间,而且会导致学习器分类性能的下降。而特征选择技术通过排除冗余和不相关的特征来减少数据维度,从而提高学习算法的性能。但在特征选择中,寻找最优特征子集是一个NP难问题,使用传统的贪婪式搜索方法极易陷入局部最优。而群智能算法中的蚁群优化算法因其出色的全局和局部搜索能力和灵活的图形表示方式而广泛应用于特征选择。但是当前基于蚁群算法的特征选择方法主
随着科学技术的不断发展,软件已服务于生活中的各个方面,同时其数量与种类仍在不断增多。但其实大多数企业采用的软件开发方式因工作的重复度过高,具有开发效率慢的缺点。因此在软件开发领域出现了一种基于软件资产进行软件开发的方式,即软件重用。软件重用的实施必须具备两个基本条件,分别是存在大量的可重用软件资产供开发人员挑选以及存在一个可重用软件资产库管理系统来管理可重用软件资产。但现有系统因具有缺少资产安全性
随着国内集成电路行业的飞速发展,芯片复杂度的不断提高,如何确保所研处理器的正确性成为了芯片研发流程中的一个重要内容。指令集模拟器(ISS)作为芯片设计、验证、应用等阶段中不可或缺的重要工具,可以通过建立目标处理器的功能模型,来模拟每条指令在目标处理器上的执行结果。对于复杂度更高的人工智能(AI)芯片,开发一款仿真速度快、模拟精度高的指令集模拟器,更是有助于加速芯片架构探索和设计,对缩短芯片研发周期