【摘 要】
:
计算机视觉已经在人工智能这个引领全球先进科技的领域中占有举足轻重的地位,目前研究者们在常规的图像增强、图像识别、目标检测等任务中已获得出色的研究成果。然而在我们日常的工作和生活场景中,仍有许多极端环境下的与图像相关的工作容易被忽视,譬如雨天、雾天、低照度、低分辨率等场景下的图像处理工作。针对其中的低照度场景,由于拍摄设备的曝光程度以及现实场景中的光线不充足等原因,通常会导致获取的图像亮度较低,并且
论文部分内容阅读
计算机视觉已经在人工智能这个引领全球先进科技的领域中占有举足轻重的地位,目前研究者们在常规的图像增强、图像识别、目标检测等任务中已获得出色的研究成果。然而在我们日常的工作和生活场景中,仍有许多极端环境下的与图像相关的工作容易被忽视,譬如雨天、雾天、低照度、低分辨率等场景下的图像处理工作。针对其中的低照度场景,由于拍摄设备的曝光程度以及现实场景中的光线不充足等原因,通常会导致获取的图像亮度较低,并且得到的图片将会丢失大量有效信息,同时视觉效果也相对较差,使得后续的图像处理如图像识别、检测、分割等任务效果不佳。目前大多数低照度图像相关的工作都是先将低照度图像进行增强亮度的预处理,再进行后续的其他任务,然而,两个独立的工作在现如今快节奏高效率的工程需求中显得过于繁琐,本文根据低照度图像的特殊性,研究出一种低照度图像增强的方法,以及一种针对低照度图像识别方法,主要内容如下:(1)针对低照度图像亮度较低、光照不均、图像特征不明显,提出了一种基于互信息变分胶囊自编码器的低照度图像增强网络。首先在编码器中通过胶囊结构获取特征以生成均值与方差,利用重参数技巧采样得到隐变量z,为了丰富生成的增强图像的用来细节,输入一个拥有先验分布的隐变量c与隐变量z进行特增融合;接着在解码器中使用由上采样和卷积层组成的三个解码块来生成增强后的图像。为了使得隐变量c与输出的生成图具有最大的依赖性,引入互信息最大化,在最大化过程中添加由四层卷积组成的Q模块对隐变量c的后验概率进行拟合。实验结果表明,该模型能够有效的增强图像的亮度,且对比其他经典模型,色彩和细节上的视觉效果更好。(2)针对低照度图像信息缺失导致的图像识别效果较差的问题,提出了一种基于注意力机制与胶囊网络的低照度图像识别算法。首先通过分别利用全局与局部注意力获取特征进行融合,全局注意力拥有更大的感受野可以获得全局感知信息,局部注意力可关注更多的细节内容,使得模型从低照度图像中获取了更多可识别的有效信息,将所得权重加权在待识别特征中,再输入到胶囊结构中,通过动态路由算法从低级实例映射到高级实例中,获取识别结果,并且在图像重构模块中,学习到正常找到图像的重要信息,进一步提高识别能力。实验结果表明,与其他常规图像识别模型相比,该模型端到端地解决了低照度图像识别的问题,并得到了更好的实验结果。
其他文献
深度学习算法在图像分类等许多应用场景中取得令人瞩目的成绩。但是,研究表明含有恶意扰动的对抗样本可以欺骗甚至操纵这些复杂神经网络模型,从而使得它们输出错误的预测结果。为了应对这种威胁,本文重点研究对抗训练和预处理防御这两种提高神经网络模型鲁棒性的方法。对抗训练,即使用对抗样本训练神经网络模型,是一种有效的防御措施。经过对抗训练的神经网络模型往往具有很强的抵御对抗样本攻击的能力,但是在训练过程中生成对
文字作为体现一个国家和民族文化的载体,其重要性不言而喻。通过使用计算机识别真实场景中的文字已经成为计算机视觉领域最重要的研究内容之一。然而现有的场景文字检测与识别算法大都针对于英文、中文等使用人数广泛的语言文字。越南文字作为一种声调语言表音文字,使用人数相对较少但具有代表性。与常见的拉丁文字不同,越南文字的书写中存在6种声调符号标记,使用不同的声调符号表达不同的语义信息,现有算法在检测与识别越南场
随着物联网的快速发展,越来越多的物联网设备接入网络,使得传感设备能够更方便的收集数据。数据采集是数据分析的前提。数据收集工作的缺乏将导致数据分析工作流于形式。因此,数据收集工作是实现大数据分析的关键步骤。然而,很多数据涉及到用户(数据提供者)的个人隐私,用户并不想提供这一部分的数据。例如,用户的身体指标数据(血压、心率等),这部分作为用户隐私被用户保护。这将导致数据收集工作的质量大打折扣。所以,隐
由于智能手机定位功能的普遍应用和数据地图的可访问性,基于位置的服务(LBSs)如雨后春笋般迅猛发展,并且已经成为了一种新的服务模式。在过去的几年里,我们目睹了基于位置的服务的广泛推广。许多LBSs相关产品应运而生。人们可以从软件平台下载许多关联应用,包括导航、社交、游戏等,来享受LBSs提供的一系列丰富的个性化服务。虽然LBSs服务便捷和市场规模广阔,但是它也引发了高度的安全担忧。例如,攻击者能够
随着网络和信息技术的飞速发展,人们已经身处于一个信息爆炸的时代。一方面人们感受到了科技发展所带来的前所未有的方便与便捷,另一方面也使得信息过载成为互联网时代的一大挑战。信息资源的急剧增加,使得用户想在纷繁复杂的网络资源中找到自己所需的内容变得十分困难。个性化推荐可以有效地缓解上述所存在的“信息过载”状况,让用户得到符合自身偏好的服务,以提升用户体验,因而具有重要的研究价值。近年来,越来越多的研究者
当前由于网络的快速普及,大量终端用户使用手机等移动设备观看视频的同时,由于对等网络技术(Peer-to-Peer,P2P)具有高扩展性、低成本等优点而受到研究者们广泛的关注。为了向终端用户更好的提供视频服务,云服务提供商与视频服务提供商结合构建一个高可用的对等网络视频点播云平台。通常,云服务提供商在不同地理区域部署大量的边缘云CDN节点,并通过租用高可用的ISP链路向终端用户提供视频服务。首先,视
近年来我国汽车保有量快速增长,停车难题也越发突出。停车场实时数据的缺乏严重制约了我国停车引导系统的建设,本文针对这一问题,将城市停车引导问题进行分解,从以下两个方面展开研究。首先,针对停车场停放需求的区域化特性,本文设计了一种停车场子网分割模型。模型基于停车场空间位置关系和初始影响力,使用Mean Shift聚类算法进行子网分割。对于子网内停车场,使用基于Page Rank算法的停车转移模型计算其
微小型无人机具有小尺寸、非金属材质和低速飞行等特点,可有效降低雷达发现概率,已成为新型雷达侦察工具。无人机集群克服了单架无人机自身性能与载荷能力的不足,并凭借其远超个体累加的侦察能力,可高效完成复杂的雷达侦察任务。无人机集群任务分配通过协调无人机与任务之间的匹配关系,实现对资源的合理调配。本文研究无人机集群侦察相控阵雷达模式转移规律过程中的任务分配优化,对集群任务分配的模型与方法进行了理论研究与仿
2020年初,新冠病毒爆发,受其影响在线课程成为学生上课的主要途径,在线教育带来极大便利的同时也产生了各种各样的问题,例如:学生反馈效果差,老师授课难度大,教学质量评估难等,为了解决这类问题,本文从课程评论出发获取评价对象的情感极性。通过对在线课程评论数据进行信息提取、情感分类和聚类分析,可以了解学习者对在线课程的观点和情感,从而对在线课程进行评估。在线课程评论数据的分析对于学习者选择课程、教学者
随着网络范围和规模的不断扩大,网络入侵的威胁比以往任何时候都要严峻。网络入侵检测系统是为了防止网络入侵而部署在计算机上的一种安全工具。由于攻击方法的日益复杂,新攻击不断出现,传统的入侵检测已无法满足检测要求,因此需要探索新的方法来检测网络中的入侵。近年来得益于深度学习的快速发展以及其在大数据分析、处理上的优势。本文以深度学习中的深度神经网络和卷积神经网络为基础,建立了一种能够自主学习的检测模型,该