基于视频序列的人脸表情识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:liongliong588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为非语言交流的一种形式,表情是人类情感表达的重要方式。深入研究人类面部表情,对于理解人类内心心理和情绪状态具有极其重要的意义。随着科学技术不断发展,面向视频序列的表情识别技术有着越来越广泛的应用。表情实质上是一种人类情绪引发的面部表观变化,包含着一个变化过程,;由于静态人脸图像包含的表情信息有限,动态的图像序列承载着更加丰富的表情上下文信息,更符合人类面部表情的产生机理,从而对其描述的更加真实精确。本文针对视频序列表情识别进行研究,从如何有效地提取视频序列的时空域信息入手,提出若干方法,并在国内外公认的表情数据库验证所提方案的有效性。本文的主要工作包括如下两个方面:(1)表情的本质是情绪引发的面部区域的运动过程,因此动态特征更适合描述表情。针对动态视频序列表情识别过程中,静态特征描述子不能够有效反映面部表情信息变化的问题,本文提出了一种融合动态纹理信息和运动信息的表情识别方法,在静态描述子韦伯局部特征(Weber Local Descriptor,WLD)的基础上,引入时间维度,提出了一种时空韦伯局部特征(Spatial-Temporal Weber Local Descriptor,STWLD),以增强对视频时空域信息的描述能力。同时,利用分块光流直方图特征(Block-based Histogram of Optical Flow,BHOF)描述相邻序列帧之间人脸区域的运动信息。最后,利用SVM对融合后的动态纹理信息和运动信息进行表情分类。实验结果表明该方法相比单一特征描述,具有更好的表情识别效果。(2)针对手工特征提取方法将特征提取和分类识别两个阶段分开研究和运算,各个阶段相互独立,不利于算法的优化和识别性能提高的问题。本文采用深度学习方法进行表情识别,提出一种基于并行卷积神经网络的视频表情识别方法。鉴于原始CNN未考虑时间维度信息,引入时间维度,构建一个3D卷积神经网络结构,以提取视频序列局部时域信息;此外,为弥补网络提取全局时域信息的不足,加入CNN-RNN网络,根据RNN的迭代特性,利用视频序列前帧信息对后续帧的影响,有效提炼时间相关信息,从而对视频全局时域信息进行描述。两种神经网络融合视频序列局部和全局时域信息,有效增强了对视频表情序列信息的描述能力。实验结果表明,该方法优于单一网络和相关文献中的方法,有效增强了识别能力。
其他文献
论文采用热力学分析、准一维估算分析和数值模拟技术以及多学科优化方法深入研究了超燃冲压发动机内流道及部件的概念设计与优化问题,并探讨了多个设计因素对发动机系统和部
从20世纪90年代开始,装配式钢结构就已经应用于我国的建筑工程当中,但装配式钢结构的质量管理却存在着信息化程度低、信息共享与协同困难、可视化程度低、质量管理评价理念匮
<正>近期,芝麻信用又添新的合作伙伴。共享服装品牌多啦衣梦宣布,芝麻信用700分以上可免除300元押金。通过芝麻信用,高评分用户可以越来越多的享受到免押金的消费服务。在出
《国际歌》中文歌词的第一位译者,是瞿秋白同志,译作时间约在本世纪二十年代初期。刚刚二十岁出头的瞿秋白,已经是青年的革命者了。一九三五年六月十八日,瞿秋白在福建长汀
非开挖技术逐渐成为城市管网建设的主要技术,其常用的方法以顶管法和定向钻法为主,但实施这些技术需要比较全面地预知施工区域内的地下信息才能确保工程顺利进行。地球物理探
<正>走在新闻业创新前沿的《纽约时报》研发实验室最近又推出了新玩意:一款叫"蜂巢(hive)"的众包开发平台。要解释2014年12月问世的这款"蜂巢",就得先回到该报此前在10月推出
人大复印报刊资料《小学语文教与学》是由教育部主管、中国人民大学主办的教学类专业期刊,首批通过国家新闻出版广电总局学术期刊认定,主要服务于一线小学语文教师和教研人员
目的 探讨精液圆形细胞对精子运动参数的影响.方法 132份精液样本,采用西班牙SCA计算机辅助精子分析系统(CASA)分析精子运动参数和精液中圆细胞浓度.结果 精液圆细胞浓度与前
期刊
<正>为了解决当前空间性规划重叠冲突、部门职责交叉重复、地方规划朝令夕改等问题,党中央提出构建全国统一、相互衔接、分级管理的国土空间规划体系,并分为国家、省和市县三
本试验在基础饲料中分别添加不同比例的酵母培养物(百惠康)替代鱼粉对草鱼进行养殖,旨在评估百惠康对草鱼生长性能和抗病力的影响。选取初始体重为9.26 g左右的健康草鱼800尾