【摘 要】
:
随着深度学习的逐步发展和计算机视觉应用领域的不断扩大,基于实验室环境下的非自发人脸表情识别已经不再是一个挑战,学界的研究重点已经转向自然环境下的人脸表情识别。尽管自然人脸表情数据集更加贴近于真实场景,但由于其样本偏小,且存在遮挡、姿态变化、光照不均等外在干扰因素,导致所训练出来的表情分类模型容易出现严重的过拟合现象。目前,如何准确地识别自然环境下的人脸表情已经成为人脸表情识别领域的主要难点之一。本
论文部分内容阅读
随着深度学习的逐步发展和计算机视觉应用领域的不断扩大,基于实验室环境下的非自发人脸表情识别已经不再是一个挑战,学界的研究重点已经转向自然环境下的人脸表情识别。尽管自然人脸表情数据集更加贴近于真实场景,但由于其样本偏小,且存在遮挡、姿态变化、光照不均等外在干扰因素,导致所训练出来的表情分类模型容易出现严重的过拟合现象。目前,如何准确地识别自然环境下的人脸表情已经成为人脸表情识别领域的主要难点之一。本文利用深度学习技术对自然环境下自发的人脸表情识别进行了深入的研究,对现有的VGGNet模型进行了改进,使之更加适用于自然人脸表情识别,并引入了对抗消除方法来提升模型的准确率和鲁棒性。本文的研究内容主要概括为以下几个方面:(1)在VGGNet模型的基础上,提出了一种针对人脸表情识别的模型,VGGFER。该模型的特征融合模块通过将普通卷积与空洞卷积进行特征融合,增加了模型的感受野,拓展了网络的宽度,并保证模型数据分布的稳定。为了缓解人脸表情识别网络的过拟合问题,本文设计了一种正则化策略,并将全局平均池化层、Dropout和附加角度裕度损失函数的特点进行融合,在降低模型参数量和过拟合风险的同时,缩小了同类特征的类内间距,并扩大了不同类特征的类间间距,使人脸表情特征更容易被人脸表情识别网络区分开。(2)在VGG-FER模型的基础上,提出了一种基于对抗消除的人脸表情识别方法,来降低遮挡因素对于模型识别准确率的影响,并进一步提升人脸表情识别网络的准确率。本文所提出的改进的对抗消除方法能够主动地消除输入图像的部分关键特征,生成新的数据集来训练新的具有不同权重分布和特征提取能力的子网络,迫使模型依据不同的特征进行表情分类判别。最后采用基于网络集成和相对多数投票法对生成的多个人脸表情识别网络进行进一步处理,得到最终的分类预测结果。本文所提出的方法在自然人脸表情数据集RAF-DB、FERPlus和遮挡表情数据集FED-RO上进行了充分的验证和分析,并取得了不错的结果。
其他文献
同一物体在不同频段的成像结果往往包含和体现出不同的直观信息,将它们有效地融合,可以展示出更丰富的信息,实现信息互补。太赫兹/毫米波无源探测成像技术,是一种通过探测不同物体在太赫兹/毫米波频段自身辐射亮温的差异来成像的技术,可以在成像图像上显示出隐匿的金属和非金属物品。将太赫兹/毫米波图像与可见光图像进行融合,能更好地体现场景、被检人外貌以及隐匿物品的综合信息,便于安检及监控等应用。本论文依托于实际
人脸识别,是一种利用使用者面部的特点实现身份认证的模式识别技术。又名肖像识别、脸部识别。大部分人脸识别系统由四个部分构成,依次为:人脸搜索(在图片中检测出人脸)、预处理、特征提取、分类匹配。在实际中,一个待识别的对象特征、比如人脸图像特征是大量的且不断变化的,为了提高识别的精确度,就需要不断地提取新的特征。在现实情况中,由于收集样本的代价过高或时间过长等原因,及时获取充足的训练样本并不容易。大多数
随着数字化技术的不断发展和成熟,软件化雷达应运而生。软件化雷达是基于标准化、模块化的数字平台,具有开放式体系架构,采用面向应用的开发模式,系统功能通过软件定义、扩展和重构的新型雷达系统,是未来雷达系统发展的重要方向。本文针对传统雷达系统体系架构兼容性和通用性差,软硬件耦合度高的问题,开展了软件化雷达在线可重构技术的研究,重点研究了在线可重构开放式架构、面向服务的组件模型以及重构管理系统。论文的主要
如今,数字成像技术已经被广泛应用于高动态范围成像和低动态范围增强等领域,但在终端设备性能快速迭代的市场环境下,基础图像在效果表现上依然受限于显示屏幕的动态范围。而目前针对图像动态范围优化的研究主要基于软件环境,性能有限,无法满足SOC图像显示系统的实时性要求。基于这一现状,论文对图像显示相关技术进行研究,并针对色调映射算法实现硬件设计与验证。论文首先阐述了色调映射技术的应用背景,并调研了国内外对色
随着世界经济的迅速发展,人们对石油的需求越来越大。因此,如何在石油开采、勘探以及钻井工作中对信息进行传递和分析已经是研究发展的一个热点。电磁式随钻法测量技术主要指的是上个世纪80年代从事石油资源开采、煤炭资源开采等工业应用领域研究而来的一种新型测量方法。采用先进的电磁波传输方式操作简便容易实现,传输的速率相对比较高,传输的可靠性强,在测量工艺过程中针对循环钻井液和循环介质的需求小,可以广泛地适用于
磁约束托卡马克聚变研究涉及众多前沿科学和工程技术难题,理论预测和实验诊断共同发展的状态。然而单独依靠诊断难以满足放电实验数据实时重构的需求,如温度密度长期难以得到完整的剖面数据,分辨率不足导致磁约束托卡马克装置物理剖面无法描述高约束模式(H模)放电的台基物理参数剖面。基于此,本研究基于通用原子能公司(General Atom,GA)为主开发的OMFIT集成模拟平台,结合HL-2A/M实验数据和理论
吸波涂层一般指一种喷覆于材料和器材表面,具有特殊微波性能的材料涂层,其使用的涂料一般又被称为微波吸收涂料,在军用以及涉密航空器应用领域也被称为雷达波吸收涂料。目前被广泛运用于相关领域的涂层材料吸收剂主要分为非金属材料基材与含金属材料基材两大部分,其中运用相对广泛的含金属材料基材可分为导电聚合物系列、多晶铁纤维系列以及铁氧体系列等。涂层本身的材料特性,基材本身的材料特性和涂覆表面的物理特性是影响涂层
随着工艺技术的发展,现代VDMOS可承受的击穿电压值越来越高,常规的VDMOS结构由于极厚的外延层,因此导通电阻值随着耐压的增加而大幅增加,高压VDMOS器件为了降低导通电阻只能通过增加芯片面积的方法,但随之而来的成本的增加又是商业生产不可忽视的因素。目前国内具有优良特性的高压VDMOS产品较少,大多微电子公司选择进口国外的VDMOS器件,而随着半导体进口量超越石油成为进口量最大的商品,自主研发高
随着科学技术与社会向前发展,无人驾驶技术的发展日新月异,登机桥也随之朝着自动对接方向发展。环境感知传感器作为无人驾驶的“眼睛”,一般有毫米波雷达、超声波雷达、激光雷达以及摄像头,但是单一传感器由于各种原因对环境的感知存在局限性。多传感器融合技术能够综合各传感器优势,实现相互之间信息互补,为系统提供信息冗余。因此本文基于两种感知系统中主流的传感器提出一种毫米波雷达与视觉融合的登机桥前方目标识别方法,
大数据是网络信息时代的客观存在,其产生的意义在于对数据进行专业存储和处理,并从中挖掘和提取所需要的知识和信息。Hadoop作为数据分布式处理系统的典型代表,在数据的分布式存储、计算、分析等多方面性能优越,为提升资源的利用率,Hadoop引入了资源统一管理调度系统YARN。YARN自带了三种资源调度器用于同构集群环境资源的分配,随着虚拟机在各大数据中心的普及,集群异构性凸显,这些内置的调度器性能极速