基于多特征和卷积神经网络的人脸表情识别

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:yourzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展,人脸表情识别逐渐成为模式识别和人工智能等领域的热点研究课题。表情是感情理解的基础,能够在一定程度上反映被识别对象的心理情绪。人脸表情识别使得计算机和机器人具有理解和表达情感的能力,从而达到更好的人机交互。它在心理学、智能机器人、安全驾驶等领域都有很多潜在的应用价值。目前已经存在各种各样的表情特征提取算法,但由于光照、姿态、年龄、遮挡、表情数据库样本数量有限等因素的影响,导致人脸表情的识别率难以提高。为了更好地提高人脸表情识别率,本文对人脸表情识别算法进行研究,提出了一种基于多特征和卷积神经网络的人脸表情识别方法。本文的主要工作如下:首先,对人脸表情图像进行一系列预处理操作。通过加权平均法将人脸表情图像从RGB空间转换到灰度空间,分别根据“三庭五眼”特征和双三次插值法对灰度图像进行裁剪与缩放,并通过直方图均衡来增强图像的局部对比度。其次,对目前主要的人脸表情特征提取算法进行了研究,并对局部二值模式(Local Binary Pattern,LBP)、Gabor小波变换以及CNN卷积层提取的特征进行可视化和三种算法分析。然后,介绍了本文所提出的基于多特征和卷积神经网络的人脸表情识别算法。分别提取一层DWT低频子带特征、LDP特征与Sobel特征三种特征图;借鉴LeNet-5与AlexNet两种经典的网络模型,设计了用于人脸表情识别的8层卷积神经网络模型FERNet(Facial Expression Recognition Networks),利用ReLU作为激活函数,加入Dropout层,防止网络训练时出现过拟合现象;将三种特征图作为FERNet的输入,对网络模型进行训练,并对卷积神经网络提取到的特征向量进行PCA降维处理,得到降维后的表情特征向量。最后,在分类识别阶段,采用支持向量机(Support Vector Machine,SVM)对人脸表情进行分类识别。分别在CK+数据库和RAF数据库上进行实验,本文的人脸表情识别率分别为95.32%和68.94%,结果表明本文提出的算法优于LBP、Gabor、GB-DBNs+SAE以及BDBN等算法。
其他文献
北二东区储层岩石是一套白垩纪陆相湖盆沉积的碎屑岩,岩石成分以长石—石英砂为主,岩石以细砂为主,油层压实程度差,油层较厚,属于高孔、高渗、中高黏度油藏。研究区目前已进
墓地殡葬习俗在我国由来已久,“入土为安”的传统观念有着很深的社会伦理根基,但由于我国人口基数庞大及随着现阶段人口老龄化速度的加快、国家城市化建设的不断推进,使得近
图像显著性检测是利用计算机模拟人类的注意机制从图像中提取出感兴趣的区域,用于后续的图像处理,该技术广泛应用于目标识别、图像检索、图像分割、基于内容感知的图像压缩等
在图像分割过程中,通常一幅图像会被分成前景(目标区域)和背景(非目标区域)两部分,对图像分割所得的目标区域进行特征提取和分析有助于我们对图像所表示的物体的本质有更好地认识并提供相应的行为方案.本文针对传统的总变分(Total Variation,TV)图像前后景分割模型在分割过程中易产生阶梯效应和丢失图像细节信息而导致分割得到的图像质量下降的问题,提出了总广义变分(Total Generalize
无意识思维是指当个体的注意指向其它无关对象时所发生的与任务或目标相关的认知或情感思维过程。研究发现,与有意识思维相比,无意识思维在创造性问题解决、说服、道德判断、人才选拔、决策等方面均存在优势效应。但是,最近研究表明,分心任务与实验任务的相似性会影响无意识思维效应。具体来说,当分心任务与实验任务相似时会阻碍无意识思维的加工,而分心任务与实验任务不相似时则有利于无意识思维的加工。但是,由于该研究的实
近年来,因脊髓损伤和中风等疾病导致肢体运动功能障碍的患者日益增多,运动康复治疗对其运动功能的恢复十分重要。康复机器人可以高精度辅助患者进行康复运动,但是对于大部分失去运动能力的人,一般只能实现被动的辅助动作,对于患者提高肌肉活性程度有限。功能性电刺激技术主要利用低频弱电流脉冲刺激瘫痪患者的肌肉使其收缩,以替代或矫正肢体已丧失的功能。然而由于人体肌肉骨骼系统是一个高度非线性的时变系统,加之肌肉疲劳等
图像分类主要根据图像的特征属性对图像进行自动分类.受光照、尺度变化等因素的影响,如何提取图像特征并对图像进行有效表示成为图像分类的主要研究问题.稀疏编码是一种高效的特征表示方法,它通过寻找一组超完备字典基向量,求得特征基于字典基的重建系数,在图像分类上取得了较好的性能.然而,稀疏编码的研究仍存在不足之处,比如忽略了字典基之间的群效应,欧氏距离不能很好地度量特征向量与字典基之间的距离,以及Lapla
人工智能时代不断进步,使得计算机在很多方面能够做到和人类一样思维的操作,大幅度提升了办事的效率,正因为科技的进步,图像检索方式也在不断进步,人们对于图像检索的需求也日渐增多,因此,如何在大规模的图像检索任务中提升速度和精度成为图像检索工程中非常关键的任务。针对如何提升大规模图像检索任务的精度和效率的问题,提出了一种结合哈希算法和生成对抗网络算法的图像检索模型。该模型在无监督条件下进行,即不利用图像
随着人们对通信质量和通信速率的需求日益增加,多输入多输出(Multiple Input Multiple Output,MIMO)技术成为4G(the 4th Generation)和5G(the 5th Generation)通信的核心技术之一。近年来基站天线多采用双极化MIMO天线的形式,主要是利用其分集增益和复用增益来提高信道容量、降低多径衰落、提高信噪比,从而提高通信质量和通信速率。天线数
显著目标检测是利用计算机模拟人眼的视觉注意机制,在大量冗余的图像或视频数据中提取最重要的部分以便于后期的图像处理,如分割、缩放等。视频显著目标检测通过逐帧检测或者