标签噪声和不平衡数据鲁棒的卷积神经网络

来源 :天津大学 | 被引量 : 0次 | 上传用户:hhugjl012800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,基于卷积神经网络的深度学习技术在计算机视觉等多个领域取得极大成功,也是最具代表性、最有效的方法。但是深度学习技术严重依赖于标签准确且类别间数据平衡的大规模数据集。然而,大规模的标签准确的数据是极难获取的,同时真实世界的数据集大多存在类别间样本不平衡的问题。针对计算机视觉领域中的图像分类和人脸识别任务,如何有效利用标签噪声的数据或类别间不平衡的数据训练出理想的深度学习模型是一个亟待解决的难题。本文针对标签噪声问题和类别间样本不平衡问题进行了深入的分析与研究,其中标签噪声问题基于人脸识别任务,类别间不平衡问题基于图像分类问题,本文的主要研究工作包括:1)针对大规模标签噪声数据的深度学习问题,提出了一种由易到难的学习策略,自动发掘干净与噪声数据,保证干净数据得到学习而放弃对标签噪声数据的学习,在类别内标签噪声和类别外标签噪声两种标签噪声环境下均取得了很高的准确率。2)针对真实世界数据集中普遍存在的类别间样本不平衡问题,设计了一种结合采样策略和平衡损失函数的方法,在对数据进行重采样后根据每个类别的样本数量进行平衡损失函数计算,方法在提升了图像分类准确率的同时加速了模型的训练。在大规模人脸数据集和多个图像分类数据集的实验结果证明本文方法可以有效解决标签噪声问题和类别间样本不平衡问题。
其他文献
生态学学科在现代的科学知识系统中占有一个中心的地位,并与各门科学(自然科学、社会科学、技术科学等)有着密切的联系。近年来提出了为广泛开展环境保护活动创造科学基础的要求。这样便出版了一些专著,试图把关于保护环境和自然界的分散的科学资料收集在一起。在国外,这项工作是在称为“环境科学”的领域
期刊
在航天领域,航天器所处的外太空环境极其复杂和恶劣,温度有时会发生剧烈变化。用于国际输油管道的传感监测系统也面临着严峻的温湿度变化的挑战。光纤布拉格光栅(FBG)传感器,因其体积小、灵敏度高、抗电磁干扰、可大量复用等诸多优点,被广泛应用于航空航天、桥梁隧道等监测领域。本文面向变温环境下基于可调谐Fabry-Perot(F-P)滤波器和氰化氢(HCN)气室的FBG高精度解调系统,针对F-P滤波透射率函
声振动信号是一种快速变化的微压信号,利用光纤声振动传感系统对声信号的检测和分析具有广阔的应用前景,因此,对高信号质量的光纤声振动传感器及高稳定性解调系统的研究具有重要意义。在传感器方面,本文针对目前膜片式光纤法珀声振动传感器振动膜片光反射率低、干涉强度低、信号对比度差等问题,设计了一种具有高反射率的聚苯硫醚薄膜镀金膜片,提高了干涉信号强度和信号对比度;在解调方面,提出了一种基于偏振双折射晶体的正交
光纤法珀传感技术以其解调精度高、动态解调范围大、抗电磁干扰等优点广泛应用于航空航天、深海探测和石油勘探等领域,随着应用的不断深入,对多个光纤法珀传感器进行同步解调的需求逐渐突显,然而传统多通道复用技术由于使用线阵CCD,在对多个通道的光纤法珀传感器进行同步解调时,为了区分各个通道的干涉信号,需要对系统光源的中心波长或者法珀传感器的腔长控制提出很高的要求,进而限制了其应用范围。本文针对上述问题,提出
制造业的蓬勃发展使得现阶段对数控机床加工精度提出了更高的要求。然而机床使用时间的增加和各零部件的老化、磨损等情况均会导致其加工精度的降低。为了维持和提高数控机床加工精度,亟需一种高效率、低成本的误差建模、检测与辨识方案。本文基于微小角度传感器和L型组合靶标阵列,提出一种三轴机床几何误差的新型辨识方案,完成的主要工作有:1、通过对比现阶段数控机床几何误差的数学建模与误差辨识方法,基于多体系统理论建立
随着机械制造业的快速发展,数控机床在模具制造、电子工程、汽车和航空航天等领域有着广泛的应用。由于具有通用性强、精度高、加工范围大等优点,数控机床已成为一种非常必要的设备。精度在数控机床中起着关键作用,目前也成为了加工自动化领域的一个热点问题。为了提高数控机床直行运动的精度,本文设计一种基于复合特征面阵列的测量系统,并基于该系统辨识机床直行运动过程中的几何误差,主要完成以下工作:1.分析了平面镜和旋
锈蚀是钢结构中一种普遍存在的缺陷。如果不及时采取锈蚀处理措施,可能会引发严重的安全事故并造成经济损失。人工视觉检查是目前最常用的结构锈蚀检测方法。该方法虽然操作简便,但是效率低、主观性强。基于计算机视觉的方法能够自动进行损伤检测,可以显著提高检测效率并给出客观地检测结果。传统的计算机视觉方法需要依赖先验知识设计特征,而深度学习算法能够自动从图像中提取出合适的特征。现有研究主要识别结构是否发生锈蚀,
目前建筑的运行能耗约为全社会商品用能的三分之一,是节能潜力最大的用能领域,也是节能工作的重点,北方城镇冬季集中供热占建筑能耗的21%,且目前管理粗放,难以满足按需供热的要求,集中供热工程势必将向着精细化的方向发展,这也对短期负荷预测的精度提出更高的要求。本文在对热负荷的影响因素及特点进行分析的基础上,结合各影响因素的重要性和可获得性确定了负荷预测模型的输入变量及预处理方法。以承德市某供热系统作为案
当前,我国冬季供暖能耗在社会总能耗中占比较大,供热节能势在必行。对供暖负荷的准确预测可以帮助运维人员提前掌握建筑的用能需求,进行精准调控,从而避免不必要的能源浪费。随着计量装置的普及以及人工智能技术的发展,机器学习技术在建筑物能耗预测方面得到了快速发展。本文以寒冷地区某住宅建筑为例,使用树模型与神经网络模型对供暖负荷进行短期预测与超短期预测,研究了两类在供暖负荷预测中的应用效果。本文首先利用相关性
"十四五"是国家电网公司迈向战略目标的关键五年。而供电所既是公司供电服务的最前沿,又是政策落地的最末端。落实"一体四翼"发展布局,提高供电所基础管理是必然要求。为解决供电所一线人员对上级政策理解不全面、业务流程不熟悉、服务要求落实不精准等一系列问题,国网山东省电力公司东营供电公司(以下简称"东营供电公司")创新搭建市、县、所贯通协同的"五点云讲堂"培训平台,以"上级政策一贯到底,基层需求及时
期刊