基于深度学习的单幅图像超分辨重建算法研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:flypig2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像超分辨重建技术因其可以方便快速地将低分辨率图像高效高质地重建为高分辨率图像而备受关注,在遥感成像、医学影像处理、视频监控等领域有广泛应用。由于计算机硬件的发展和训练算法的进步,深度学习具有强大的处理大量非结构化数据的能力。近年来,基于深度学习的单幅图像超分辨重建技术取得了较大进展。但是,考虑到任务自身的难点以及主客观评价指标的差异,已有研究成果与实际应用间还存在差距。因此,本文针对基于深度学习的单幅图像超分辨重建算法进行了深入研究,并提出了三种不同的解决方案。本文主要工作概括如下:首先,对单幅图像超分辨重建相关文献进行了回顾,对基于学习的相关工作进行了分类与总结,按照神经网络结构和优化目标函数两个方向,介绍了其中代表性工作,并对解决思路与关键算法进行梳理。其次,针对传统的单幅图像超分辨重建任务,构建了一种多尺度残差模块,在此基础上提出了一种基于多尺度深度残差网络的单幅图像超分辨重建算法MSCDR。多尺度残差块采用双通道设置,分别包含1×1卷积核和3×3卷积核,既拓展网络宽度又扩大网络感受野,可以增强网络的非线性表达能力,并且有利于提取更多的细节特征。移除批规范化层,从而节约计算资源。通过级联亚像素卷积层,使得整个训练过程在低分辨率空间中进行,进一步提升训练速度。通过在公共数据集中对MSCDR算法进行测试,验证了该算法的有效性。然后,针对MSCDR算法在高放大倍数时重建效果不理想的问题,提出了一种基于Wasserstein距离的超分辨生成对抗网络WDSRGAN。采用Wasserstein距离衡量真实分布与生成分布间的距离。在WDSRGAN网络中,生成器是基于多尺度残差块的深度残差网络,判别器是一种类VGG模型的前馈神经网络,优化目标为最小化感知损失,包括内容损失和对抗性损失。内容损失着眼于图像内容本身,对抗性损失则更多地聚焦于纹理细节等高频信息。通过在公共数据集中进行测试,WDSRGAN算法能够更好地恢复低分辨率图像中缺乏的高频细节,人眼感知效果更好。最后,在已有多尺度残差模块和感知损失的基础上,进一步提出了一种基于感知损失的多尺度深度残差网络PLMDR。PLMDR包含生成网络和损失网络两个部分,生成网络由多尺度深度残差网络组成,损失网络由预训练的VGG-19构成,采用图像高维特征图差异作为损失函数。实验结果表明,PLMDR同样获得了令人满意的视觉效果,并进一步验证了作为客观指标的PSNR/SSIM和人眼主观视觉感受相关性较弱。
其他文献
立式轴流泵装置常采用的两种出水流道结构型式为直管式和虹吸式,出水流道引导水流从水泵导叶体出口流向出水池的过程中更好地转向和平缓扩散,是低扬程泵站的关键组成部分,对泵装置效率有较大影响,因此,对直管式及虹吸式两种型式出水流道的水力性能进行较为准确的分析和评价,从而合理选择泵装置出水流道的型式至关重要。为此,本文运用数值模拟与模型试验相结合的方法,以立式轴流泵装置为研究对象,对立式轴流泵装置匹配的直管
目的研究慢性肾脏病(CKD)非透析患者不同部位骨密度情况及其与血管钙化的关系。方法双能X线骨密度仪测定腰椎、股骨及桡骨骨密度,多部位X线平片检测血管钙化情况,检测血肌酐、
利用常规气象资料、卫星红外云图、自动气象站资料和NECP(1°×1°)逐6h再分析资料对此次暴雨过程的成因及预报失败原因进行分析。结果表明:冷涡东移南掉、低层涡旋
介绍在我国长江上游这种水深、流急、航道狭窄、航运繁忙、覆盖层为卵(漂)石的条件下,渝怀铁路长寿长江特大桥水中墩基础采用双壁吊箱围堰方法施工,包括双壁吊箱围堰结构、锚