论文部分内容阅读
模式识别、机器学习的广泛研究以及各部门系统对于安全级别要求的提高,促使人脸识别技术的自动化、智能化、速度化、精准化成为研究的热点。随着光照、姿态、表情等的变化,人脸图像的识别是一项复杂且非线性的分类问题。在模式识别领域,大部分模式也是线性不可分的,因此寻求高效的算法来进行非线性模式的划分越来越受到关注。核方法的提出解决了非线性模式线性不可分的问题,通过合适的特征映射函数将输入空间嵌入到隐式的高维特征空间,以达到线性可分的目的。同时,由于现实世界中存在着的很多结构化数据,其最有效的表示形式就是图,因此基于图的核函数,即图核被广泛提出,主要包括随机通路核、最短路径核、子树核、回路核及卷积核等等。图核函数依据相似性度量方法实现了从图空间到内积空间的嵌入,通过它们的两两内积来计算核函数的值,不需要显示的计算其坐标。好的图核函数应满足四个标准:易于表示,可高效计算,正定性质,适用范围广。随机通路核比较的是两个输入图中相匹配的的通路数目,允许结点和边的重复,人为地提高了相似值;最短路径核忽略了最短路径所经结点和边的标签信息,造成部分信息的丢失。本文针对这两点提出了生成树基本通路核及最短路径基本通路核,此外,根据人脸特征点的分布情况,提出了主要路径核及角度-边核,它们易于表示,可计算,且满足正定性质,有一定的适用范围。最后,将这些图核函数应用到支撑向量机中对人脸图像进行分类识别。 本文的工作内容及创新点主要集中在以下几个方面:⑴深入了解了核函数的思想原理,即把非线性数据模式的输入空间映射到一个线性可分的隐性高维特征空间;分析研究核函数的性质,特征空间嵌入方式,讨论了现有图核的构造原理和方法。⑵针对随机通路核中允许结点和边重复的问题,提出了生成树基本通路核;考虑到最短路径核忽略了路径上结点和边的标签信息,提出了最短路径基本通路核及生成树核,这些图核是正定的,可计算的,而且充分利用了图中的信息。⑶根据关键路径的定义以及人脸特征点的分布特点,提出了主要路径核和角度-边核,实验表明,在识别正确率与其他图核函数相差甚微的情况下,运行时间要大大降低。⑷通过最后的实验结果得知,本文提出的图核函数有其适用范围,也有很好的识别效果,时间复杂度低于某些已有的图核函数。