【摘 要】
:
计算机视觉(Computer Vision,CV)领域有四大关键任务:图像检测、图像识别、图像分割以及图像生成,本文主要聚焦于图像生成分支。随着人工智能逐渐发展至认知阶段,生成已成为人工智能发展的关键技术。近年来,图像修复和翻译技术由于具有广泛的应用价值而备受国内外学者的关注。图像修复旨在根据图像中的已知信息恢复出丢失区域的内容,从而使图像在整体和局部区域均保持真实合理。图像翻译旨在将一种图像表征
论文部分内容阅读
计算机视觉(Computer Vision,CV)领域有四大关键任务:图像检测、图像识别、图像分割以及图像生成,本文主要聚焦于图像生成分支。随着人工智能逐渐发展至认知阶段,生成已成为人工智能发展的关键技术。近年来,图像修复和翻译技术由于具有广泛的应用价值而备受国内外学者的关注。图像修复旨在根据图像中的已知信息恢复出丢失区域的内容,从而使图像在整体和局部区域均保持真实合理。图像翻译旨在将一种图像表征通过深度神经网络转换为另一种图像表征,可以被视为是寻找两个或多个图像域之间的映射关系。目前大多数的相关算法都是针对自然图像进行研究,对于特殊人工图像的关注相对比较匮乏。为了弥补研究空缺,本文基于沃瑟斯坦生成对抗网络对中国古画进行图像修复以及图像翻译的算法研究,具体的研究内容如下:(1)由于中国古画的细节繁多且具有大量不规则的凹凸纹理特征,因此本文提出了一种细节增强型的古画修复模型。首先,本文分析了传统图像修复算法无法解决人工图像修复任务的根本原因,并且针对该问题设计了具有多任务分支结构的修复网络。多任务分支结构通过将修复任务分解为内容和线条两个部分,使得修复网络能有效地关注到图像的细节区域,从而使修复结果在细节上更加逼真自然。另外,本文引入了结构引导机制,该机制允许用户根据个人的偏好参与古画修复的过程,并且本文设计了用户引导实验对该机制进行了验证,结果表明本文提出的模型可以根据用户提供的信息进行个性化修复。最后,本文设计多种损失联合优化模型,并且通过扩展实验进一步验证了模型的通用性以及鲁棒性。(2)传统的图像翻译模型容易使图像的底层结构特征在编码过程中逐渐丢失,从而无法生成纹理清晰的结果。为此,本文引入多种注意力机制并结合多编码器架构,提出了一种新颖的古画上色模型。首先,本文设计了多编码器架构用于降低颜色特征与线条特征融合的难度,从而改善古画上色的效果。其次,本文提出了一种全新的通道注意力机制,该机制使内容编码器能高效地结合与线条特征响应度最大的颜色特征,使上色结果的颜色更加均匀。最后,本文利用带有门控注意力引导的跳跃连接机制辅助内容编码器将底层的显著性特征传递给解码器,从而避免了无效特征对模型的影响。大量的实验表明,本文提出的模型能将参考图像的颜色信息与古画的线条信息进行合理地融合,并且可以有效地保留线条图像的底层不变特征,解决了现有图像翻译模型在特殊人工图像数据集上效果不佳的问题。
其他文献
轮轴作为我国复兴号动车组走行部的重要部件之一,在车辆的安全运行中起着至关重要的作用。随着动车组行驶速度的不断提高,载重的不断加大,对轮轴压装配合区域的应力分布情况及疲劳可靠性方面进行相关研究具有重要的意义。本文以CRH某型动车组轮轴为研究对象,对轮轴的压装配合进行了仿真分析,探讨了不同参数变化对轮轴压装配合区域应力的影响;依托线路实测的动应力数据,编制了轮轴压装配合关键部位的载荷谱;依据编制的载荷
时至今日,肺癌已成为发病率和死亡率上升最快、对人类健康和生命构成最大威胁的恶性肿瘤之一。肺癌如果能在早期诊断并切除可以极大的提高病人的生存率。当前,活体组织检查是临床上确定肿瘤良恶性的“金标准”,但具有相当的局限性。肺癌的主要驱动因素是肺结节大小,肺结节分为良性和恶性两类。针对肺部CT图像中的肺结节进行良恶性分类是临床上进行肺癌筛查和早期诊断的主要方式。计算机辅助诊断技术可以辅助医生进行肺结节的良
机械系统的运行好坏与滚动轴承的运行工况息息相关,滚动轴承作为旋转机械中的重要支撑部件,对其进行早期的故障模式识别是机械系统可靠性分析的关键工作。在现有的模型识别方法中,支持向量机(Support Vector Machine,SVM)的数学理论更为完备,在故障诊断领域的应用也较为成熟。因此本文就SVM的数学理论展开深入研究,学习借鉴SVM的最大边距思想,在此基础上引入附权重优化的0-1百分比损失函
随着我国城市轨道交通线网规模的不断扩大,轨道交通所承担的客流日益增加,客流分布状态愈加复杂,既有单线运营模式及“浅层次”网络运营模式下的单一化的行车组织手段已难以满足乘客和企业的需求,乘客出行体验差、换乘站客流组织难度大等问题日益凸显。互联互通为多样化、灵活化的行车组织手段创造了实施条件,有望成为解决上述问题的途径,而多样化、灵活化的行车组织对企业的运输组织方案提出了更高的要求。列车开行方案是企业
随着化石能源的日益枯竭以及环境问题的逐渐加剧,建设高比例可再生能源的能源系统势在必行。然而,高比例可再生能源的并网会使电力系统的源荷不匹配问题更加突出,这要求供能系统具有更强的能量调节能力。综合能源系统可以实现不同形式能量的耦合互补与高效利用,其中的能量储存部分对于改善能量的时间分布起到了重要作用。但是,在综合能源系统中存在多种能量形式的储能设备,如何协调优化配置多种储能以实现能量的最优供需平衡,
随着移动通信技术的快速发展,地面通信技术已经逐渐不能满足人们对无线通信的要求,因此发展卫星通信和卫星网络是下一代网络建设中非常重要的一部分。卫星网络与地面网络相比有很多优点,比如通信范围大、通信距离远、通信容量大、覆盖范围广等。但是,卫星设备自身存在存储和计算资源受限的问题,加之卫星一直绕地球不停的高速运动,致使卫星网络拓扑结构的变化较为频繁,从而使得卫星网络路由相对于地面路由来说更为困难。基于以
自《北京城市总体规划(2016年—2035年)》发布以来,持续推动减量发展,积极探索存量更新路径,成为北京城市发展建设的主流趋势。社区作为城市空间的基本组成单元与居民生活空间,是城市存量发展的建设的重要对象。在社区更新治理中,社区型街道空间不仅仅只是是城市中的线性公共空间,同时兼具着交通、商业、开展公共活动的多重职能,是贴近居民日常出行和生活服务的重要空间载体。而当前的社区街道空间与居民快速发展的
随着我国下一代列控系统的深入研究,车车通信、互联互通的新模式对列车测速系统的结果提出了更高的要求。多源信息融合测速方式具有高可靠性、强冗余性、高精度的特点,是国内外列车测速领域的重点研究方向。目前列车使用单一测速技术具有局限性,导致列车测速准确性较低,因此本文在研究对比列车测速的不同方式后,提出了不依靠轨旁设备的多传感器测速方案,使用OPG脉冲测速传感器、多普勒雷达测速传感器和加速度计的组合测速方
运力评估是所有铁路系统的一个重要话题,因为铁路系统的运营能力不但受现有的基建设施的影响,而且在很大程度上也受基建设施使用情况的影响。因此,运力评估为如何最佳利用现有基础设施提供了有价值的信息。运力评估还清楚地揭示了在现有可用容量被用尽的情况下,(如需要)在何处投资改善网络容量。面对快速增长的需求,世界上多数铁路网已经实现最大运力利用率,铁路管理者必须找到高效、经济的方法来提高运力。本研究旨在评估和