基于视频的人脸表情识别

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wbgbg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情识别是一项很富挑战性的工作;而且由于它在很多实际应用方面(人机交互、医疗行业、心理学等)都很有应用前景,所以这项工作也相当具有吸引力。以前大部分的研究都是针对于单幅图像的,本文在总结前人研究的基础上,提出了一种基于视频的表情识别方法(是对表情从:无—有—无,这个过程的识别。),该方法综合运用了ASM特征点的轨迹和时空兴趣点来提取表情特征,并选择SVM分类器对表情进行分类。本文通过提取视频中各帧图像的ASM标定点,从而得到ASM标定点的轨迹。为了有效地表示轨迹特征,本文使用马尔科夫转移矩阵对这种时空上下文信息进行编码,并抽取它的固定分布向量作为最终的上下文描述值。接着本文提取视频的时空兴趣点,并用兴趣点周围时空窗口上的立方体数据作为兴趣点的特征描述值。为了有效地描述视频信息,本文使用最近比较流行的“词袋模型”方法;本文所采用的具体做法是:使用K-means聚类算法为立方体特征描述值构造一个拥有250个词的词表,并将这些立方体特征描述值分配给最近的词(采用欧式距离作判断),这样一个表情视频最终就可以用该视频中所出现的时空兴趣点的类别直方图来表示。本文经过多次试验,最终选择先用多维非线性SVM以ASM标定点轨迹特征作为分类特征对表情进行初步分类,确定最有可能的三类表情;然后再用多维非线性SVM以时空兴趣点作为分类特征对表情进行最终的分类,在已确定的三类中识别出最终的表情类别。该方法在dollar提供的数据库上实验时,所得到的总识别率为91.7%,这一结果表明本文的算法还是比较好的。
其他文献
近几年来,大规模的文本分类问题是一个十分热门的话题,特别是在针对网络数据的网页分类问题以及层次分类问题。并且,在基于维基百科等大量网络数据的处理中,大规模的样本类数
当前高档汽车广泛使用嵌入式处理器、现场总线和控制软件等电子技术实现和控制汽车部分功能,形成复杂的分布式控制系统,并且安装了越来越多的智能传感器,其所需处理的信息大
随着 Web技术的发展,Web服务在互联网中的数量迅速增长,互联网上出现了大量在功能上相同或相近的 Web服务,但是它们的非功能属性往往是不同的,因此在对这些服务进行操作时,不仅需
随着科技的发展和各应用领域需求的日益增长,计算机视觉研究一直以来都被国内外研究者密切关注,动态前景分离作为计算机视觉的低层处理部分,其分离结果一方面直接决定着动态
随着网络技术的快速发展,网络业务不仅包括传统的数据业务,还包括语音、视频等多媒体业务。多媒体业务要求网络提供很高的带宽,低时延和低抖动等。为满足新型网络业务的服务
无线多媒体传感器网络是在传统的传感器网络的基础上发展而来的,引入了多媒体信息的感知内容(如视频、音频等),具有更强的感知能力。但是,传感器节点资源(能量、带宽等)有限,而多
随着Internet的迅速发展,大数据时代已悄无声息地到来,数据的规模较之过去已呈现出井喷式的增长态势,同时数据结构亦愈发复杂多变。在这样的情势下,由于传统的数据分析方法在
由于互联网技术的不断进步与各类电子终端的迅速普及,我们获取资讯的方式发生了重大的改变,网络信息已经成为社会中各种信息的重要载体。其中,新闻视频以其丰富、直观表达方式成
随着网络、通信和计算机技术的迅速发展,数据挖掘呈现出数据海量化,分布式挖掘等特点,如何在挖掘过程中保护隐私数据和防止敏感信息泄露已成为当前面临的重大挑战,隐私保护数
高压输电线路绝缘子发生闪络往往导致长时间大面积的停电事故,对国民经济造成巨大损害,因此对输电线路上绝缘子发生闪络的监测及预防意义重大,而对绝缘子闪络监测及预防的基础工作就是对绝缘子泄漏电流进行数据分析。本文首先对EMD算法进行了改进,用改进后的EMD算法对绝缘子泄漏电流数据进行了分解,并用小波阈值去噪方法对分解后的数值进行去噪,然后对去噪后的数据进行Hilbert变换得到其时频谱及边际能量谱,最后