【摘 要】
:
图像语义分割作为人工智能领域中一个重要分支,旨在为图像中的所有像素分配类别标签。图像语义分割技术在自动驾驶、机器人控制、医学成像和时尚推荐等许多应用中起着至关重要的作用。随着深度网络的发展,特别是全卷积神经网络的出现,研究者们提出了多种端到端的语义分割方法。虽然这些方法取得了良好的效果,但也存在一定的局限性。在此基础上,本文从注意力模块和多尺度特征融合的角度出发,提出了两种不同结构的分割模型。本文
论文部分内容阅读
图像语义分割作为人工智能领域中一个重要分支,旨在为图像中的所有像素分配类别标签。图像语义分割技术在自动驾驶、机器人控制、医学成像和时尚推荐等许多应用中起着至关重要的作用。随着深度网络的发展,特别是全卷积神经网络的出现,研究者们提出了多种端到端的语义分割方法。虽然这些方法取得了良好的效果,但也存在一定的局限性。在此基础上,本文从注意力模块和多尺度特征融合的角度出发,提出了两种不同结构的分割模型。本文的主要研究工作如下:(1)研究及对比分析了图像语义分割中的经典算法:FCN、DPN、Deep Lab和PSPNet。FCN算法的主要特点是去除了卷积神经网络中的全连接层,并且使用了不同深度层次的跳级(skip)结构来提高分割性能。DPN算法使用了高阶循环卷积神经网络,用来提取图像特征。Deep Lab算法使用空洞卷积来扩大感受野,增强图像特征表达能力。PSPNet算法则结合金字塔池模块,用于场景解析。通过对以上经典算法的实验分析与对比,本文在FCN网络和PSPNet网络基础上进行研究,用于图像语义分割任务。(2)提出了基于编解码结构的图像语义分割模型(U-SEM)。该模型由空洞空间金字塔池化模块和深度可分离卷积的通道注意力模块组成。空洞空间金字塔池化模块通过采用改进的4层空洞卷积层和全局平均池化层来获取多尺度信息。深度可分离卷积的通道注意力模块是通道注意力机制与深度可分离卷积结合,用来校准不同通道上特征信息的一致性,同时采用跳级结构将编码网络的低层特征传输到解码端网络中,增强低层图像细节信息与高层语义信息高效融合,不断提高图像分割性能。在Pascal voc2012和Cityscapes数据集的实验结果表明了U-SEM模型增强了图像特征表达能力,优化了物体的分割边缘,提高了分割的精度。(3)提出了基于多尺度特征融合的图像语义分割模型(DA-Res2Net)。本模型主要由稠密型特征提取网络、注意力模块和金字塔池化模块三部分组成。稠密型特征提取网络以更加细粒度的方式来表示多尺度特征,扩大了每个网络层的感受野范围,提高了图像提取特征能力。在构建网络中,引入注意力模块,结合Softmax函数进行归一化,得到表征不同通道贡献率的概率分布值。金字塔池化模块用于融合不同层级的多尺度特征,金字塔池化模块主要用于融合不同层级的多尺度特征,提高图像分割效果。在Pascal voc2012和Cityscapes的实验结果,表明了DA-Res2Net模型可以增强图像上下文联系能力和特征提取表达能力,进而提高了小目标的分割精度。
其他文献
低共熔溶剂(DESs)作为一种新型可设计的绿色溶剂,在催化、分离、吸附、材料合成等方面表现出优异的性能,尤其是在催化剂的结构调控中表现出巨大的潜力。正丁烷选择性氧化制马来
由于人口增长和工业化造成的水污染加剧,使得地球上可供人类直接利用的淡水资源严重匮乏,这造成了严重的水资源供需矛盾。通过脱盐技术将地球上储量丰富的海水和苦咸水转化成
平潭岛是福建最大海岛和中国第五大岛,发展定位为海峡西岸生态宜居的国际旅游岛,近年来城市大规模开发建设对生态环境造成深刻影响。平潭是一个生态基础较差的海岛,由于生物
研究目的:本研究通过对两组间警觉、平衡和脑影像的检测与记录,而后进行警觉与平衡的差异性检验、二者的相关性检验以及共享脑区位置分析,最后结合相关文献证据对实验结果进
激光器的输出反馈光能够改变激光器的输出特征,由于反馈光携带腔外的物体信息,激光自混合干涉(Self-mixing Interference,SMI)技术利用该特性可实现对目标物体物理量的测量。由于SMI具有结构简单、灵敏度高、易于准直、便于探测等优点,已被广泛应用于测量位移、振动、形貌、加速度、微小角度等领域中。但SMI检测系统在实际应用时存在噪声干扰的问题,如不采取有效措施减少噪声对系统的影响,
近场声全息技术是声场预报和声源识别的一种重要途径,通过提取声源近场附近的声场所包含的信息即可计算出声源表面声压和质点振速等声学量,进而重建出整个三维声场。传统近场声全息技术要求所有声源均处于全息面的一边,而另一边为自由场。实际上,声源所处的环境往往并非自由场,通常会有边界的限制,这就导致了全息测量面获得声场数据不仅仅是声源的直接辐射的声波,还包括了由于界面多次反射所产生的声波。由此,在非自由场中,
物体入水噪声是物体从空气穿透水面进入水介质时,在冲击点水面下形成的瞬态噪声信号,不同的噪声信号反映了不同入水物体的特性。自然界降雨噪声也属于物体入水噪声,且单雨滴的噪声特性能反映降雨噪声的特性,而目前对于物体入水噪声能量的研究较少,因此本文选择单雨滴和实心钢球这两种较为典型的流体和刚体,对两者入水产生的瞬态噪声的声学特性进行研究。为了保证实验结果的可靠性,本文设计了两种分别用于发射钢球和产生单个雨
在传统以及新型工业制造中,旋转机械都是极其重要的部件,肩负着动力转矩的输出和传动,广泛应用在发动机、离心机、汽轮机和压缩机中等等。随着旋转机械在各行业的不断应用发展,对旋转机械的超临界转速、结构(双转子或三转子)和功率也提出了越来越高的要求。磁流变液(Magnetorheological fluid,MRF)是一种新型智能材料,在磁场的作用下,可形成带有刚度和阻尼的链状结构,其产生的刚度和阻尼会随
我国部分油田已经进入开发中后期,逐步进入低输量运行阶段,泵、管道等设备面临到达安全运行极限的风险。不仅如此,我国大部分油田所开采的原油属于高黏高凝原油,需采用加热输送方式进行输送,若加热温度偏高会产生大量的能耗,若加热温度较低会影响系统运行安全,特别是在油田进入低输量阶段后,对加热温度的把控更为重要。除此之外,输油压力也需要控制在合理范围,以保证输油安全的同时降低能耗。因此,为了降低外输油系统运行
分子自组装是一种强大的“自下向上”的策略,用于特定纳米图案的纳米制造。由于在分离技术、分子催化和分子传感器等方面的潜在应用,固体表面的主客体自组装成为一个迅速发展