论文部分内容阅读
随着人工智能与计算机视觉的快速发展,人机交互受到人们的广泛关注。因为人类不同表情的差异非常小,因此,让计算机准确的识别人脸面部表情是一项极具挑战性的任务。人脸表情识别(Face Expression Recognition,FER)是利用计算机来分析人的面部表情,进而识别出面部的真实情绪,对人机交互具有实际的应用价值。传统的人脸表情识别方法是基于研究人员手工设计的特征,对计算机性能要求不高,但识别率有限。针对以上问题,本文采用深度学习方法来进行人脸表情的识别。论文中主要是对静态图片进行人脸面部表情识别,主要研究工作如下:1)对人脸图像进行裁剪,然后对裁剪好的表情图像进行基于双线性插值的尺度归一化处理和基于直方图均衡化算法的灰度归一化处理,最终得到尺度和灰度都统一的人脸表情图像。2)针对表情识别中损失函数收敛困难等缺点,使用双重损失函数,结合中心损失和交叉熵损失以监督网络模型的训练,保证分类正确的同时,能减小各个表情的类内差距,增大类间距离,进一步提高表情的识别率。3)提出了改进的跨连接卷积神经网络的人脸表情识别方法。在卷积神经网络的基础上,对网络中的池化层实现了跨连接,然后将融合后的特征送入全连接层,最后用Softmax分类器对其进行分类。网络中激活函数SeLU的使用,会使网络在训练的过程中收敛速度加快。使用改进的卷积神经网络模型方法分别在FER2013和CK+两个表情数据库上进行人脸表情识别的实验,与其它卷积神经网络实验结果进行比较,验证了本文方法的有效性。实验结果表明,本文提出的改进的跨链接卷积神经网络的人脸表情特征提取方法可以更精确的识别人脸面部表情,具有较强的泛化能力。