支持向量机若干关键问题及其应用的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wlflfxzq45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对支持向量机目前存在的若干关键问题展开深入的研究,涉及支持向量机的训练、分类、模型选择和多分类器构造等方面,并将研究成果应用于人脸识别问题中。取得的创新性成果主要如下: (1)提出一种快速支持向量机分类算法FCSVM。FCSVM算法旨在减少分类方程中的支持向量数量以提高分类速度,对支持向量集采用变换的方式,用少量的支持向量代替全部支持向量进行分类计算,并在决策过程中保留所有支持向量的信息量,在一定条件下保证不损失分类精度,同时使得分类速度有较大提高。在UCI标准数据集上进行的分类实验以及在FERET标准人脸库上进行的人脸识别实验都表明该算法具有较好的性能,在一定程度上克服了传统的支持向量机分类速度较慢的缺点,尤其在训练集规模庞大、支持向量数量较多的情况下,采用该算法能够较大幅度地减小计算复杂度、提高分类速度,改善支持向量机的性能。 (2)提出一种支持向量机核参数优化选择算法OMSA。OMSA算法以核矩阵和核校准的概念为基础,通过对核矩阵的研究,根据核矩阵的对称正定性,用优化的方式实现核函数参数的选择,仅利用训练样本且不通过SVM标准训练和测试过程而寻求最优的核参数和相应的最优学习模型,改善了目前支持向量机在模型选择方面经验性强和计算量大的缺点。采用该算法在UCI标准数据集和FERET标准人脸库上进行了实验,结果表明通过该算法找到的核参数以及相应的核矩阵是最优的,为SVM最优模型选择提供了一种方法。 (3)提出一种基于差异的支持向量机多分类算法DMSVM。DMSVM算法引入了样本特征差异的概念,根据特征差异将整个多分类系统构造为一个二分类问题,实现过程中只需要求解一个二次规划,减小了计算复杂度。在UCI标准数据集上的分类实验以及在FERET和BioID标准人脸库上的人脸识别实验都表明该算法比其他一些SVM多分类方法具有更快的速度和更高的正确率,且具有较大的灵活性和较好的可扩展性,适用于较大规模的分类问题,改善了传统SVM方法在解决多分类问题上的不足。 (4)提出一种球结构支持向量机多分类算法SMSVM。SMSVM算法以一类分类方法为基础,将同一类数据用一个超球来界定,特征空间中的多类样本由多个超球来构成,不同的超球包含不同类的样本,以各个超球之间的边界来区分不同类的样本而实现多分类。在UCI标准数据集上的分类实验以及在Yale和ORL标准人脸库上的人脸识别实验都表明该算法具有计算复杂性小、速度快、易于扩充等优点,可以用来处理规模较大的分类问题。 (5)设计和实现了一个人脸识别考勤系统。提出一种改进的基于SVD分解的人脸特征提取方法,采用该方法所得到的人脸图像的代数特征不仅削弱了光照和表情的影响,而且维数大大降低,减少了计算复杂度,同时保留了人脸图像的绝大部分有效特征,在标准的FERET、BioID人脸库和我们实验室的NDAILab人脸库上进行的实验表明其效果很好,正确识别率有一定程度的提高。将该人脸特征提取方法和本文提出的DMSVM方法以及一种基于可疑人脸发现的人脸检测方法应用到实际的人脸识别问题中,设计并实现了一个人脸识别考勤系统,该系统在实际应用中有效地减少了冒名顶替的现象,减轻了考勤人员的劳动强度,取得了良好的效果。
其他文献
网络技术的发展及用户对多种业务需求的增长,使得原来独立设计运营的电信网,国际互连网和有线电视网正通过多种方式相互融合。在核心网领域,专家们已经达成使用IP分组交换网络的
近年来,数据仓库技术成为计算机领域研究和应用的热点之一。数据仓库从理论研究进入到实际应用,发展速度十分惊人。实践证明,数据仓库技术在为企业或政府科学地提高决策支持水平
Verilog是工业界广泛使用的一种硬件描述语言,可用于不同抽象层次的数字系统建模.为了确保开发的正确性,对Verilog语言的准确理解是十分必要的.而目前它的形式化语义研究还不
对等网技术是 Internet上的一种分布式网络控制技术,它将逐渐取代传统的C/S模式,使Internet的应用从中心服务器模式向网络节点边缘化方向发展。  当前P2P应用系统的特点在
本文以高校艺术类考生面试为例,介绍了面试的流程和其中存在的问题,提出了建立网络评分管理系统的必要性和系统建设的目标、系统的主要功能及系统采用的关键技术。 针对本系
随着软件产业的不断发展,软件应用的日益广泛,软件开发面临着越来越多的挑战,软件危机也随而生。软件复用在这种背景下发展起来,它是解决软件危机的有效途径。作为软件复用核心技
由于在满足企业级系统安全需求方面显示了极大的优势,基于角色的访问控制(RBAC)近年来成为访问控制领域的研究热点。研究人员已经提出若干基于角色的访问控制模型,其中包括著名
本文主要讨论了数据挖掘的一些基本概念、模式、算法及其在税务系统中的应用,并围绕数据挖掘讨论了解决目前在税务系统中存在的问题的一个解决方案。 首先,本文说明了什么是
多元变参数振动钻削是一种为适应新型材料的出现而进行的优化切削过程,在切削过程中为提高孔加工质量而提出的最优化加工方法。该方法在钻削过程的不同区段,要求采用该区段的最
本文所研究的数字签名就是一种常用的信息安全技术,而其中的多重数字签名正受到人们越来越多的关注.可是,已有的椭圆曲线多重数字签名方案只适合进行广播多重签名,不适合进行