【摘 要】
:
支持向量机(Support Vector Machine)是数据挖掘的新方法,也是一种小样本统计工具,它在解决小样本、非线性及高维的模式识别问题上具有其他机器学习方法难以企及的优势。在支
论文部分内容阅读
支持向量机(Support Vector Machine)是数据挖掘的新方法,也是一种小样本统计工具,它在解决小样本、非线性及高维的模式识别问题上具有其他机器学习方法难以企及的优势。在支持向量机二类分类方法的基础上,本文深入研究了多类分类的算法及其应用。巴塞尔新资本协议希望并鼓励银行业发展内部信用评级系统,如何寻找到一种客观、可行的评级方法,如何构建内部评级系统,对国内银行从业者提出了新的要求和挑战。信用评级从科学的角度对信用度进行定性和定量分析,其本质是一个非线性的分类问题,用支持向量机可以很好地解决。本文在前人研究的基础上,围绕着支持向量机多类分类算法的改进及其在信用评级领域应用而展开。首先,根据巴塞尔新资本协议提出的信用评级体系,建立对应的评级模型。该模型的建立将信用评级过程标准化,层次化。本文主要针对模型层进行分析,通过改进模型层的核心算法,实现不同的评级方法。其次,将层次支持向量机、纠错编码支持向量机等几种适合用于多类分类的算法加以改变和优化,使之有更好的分类效果。然后结合银行提供的评级样本,使用工具箱实现了机器学习和数据评估过程。最后从性能、分类效果和易实现等角度分析了这几种多类分类算法的相对优劣。本文还分析了核函数的选取对支持向量机分类结果的影响,通过调节参数,对不同参数条件下的分类效果进行实验。分析了几种最常见核函数的性能和特点,阐述了核函数的构造和相关定理,选择实验所用的核函数——Gauss径向基核函数;同时研究了Gauss径向基核函数两个参数意义,根据数据源样本对两个参数σ和C进行调整,找寻参数值与支持向量机学习、推广性能之间的关系,最后总结了参数调节的方法。
其他文献
在通信业急速发展的今天,增量市场潜力越来越小,通信运营商发展目标越来越集中于存量市场。伴随着通信行业竞争的日益激烈,提高移动用户稳定性和忠诚度已经成为决定盈利能力的关
随着计算机技术的不断发展,其满足人们需求的能力不断增强,其深入领域也在不断增大。软件复用一直以来被认为是提高软件生产力和解决软件危机的有效途径。通过几十年的发展,
随着社会的进步,嵌入式系统正在悄悄的融入到人们的日常生活中:从多功能手机到MP4娱乐手持设备,从智能家电控制到汽车智能电子控制,生活中的嵌入式系统无处不在。随着嵌入式
视频中运动目标跟踪是计算机视觉领域中最富有挑战性的课题之一,在军事制导、视觉导航、安全监控、智能交通、视频编码、医疗诊断和气象分析等众多领域中有着广阔的研究和应
中文分词是中文信息处理中的一个基础部分,中文信息处理要从三个层面上对中文进行处理:字、词、句。在汉语中,词是最小的语言单位,只有处理好词层面的问题,才能更好地处理句
随着汽车保有量的增长,道路交通事故已成为世界性的问题,汽车被动安全性也成为汽车最首要的性能。汽车被动安全性研究一般有三种方法,即理论计算法、交通事故分析法和试验法,
随着科学技术的不断创新,计算机病毒技术也越来越多样化。为了对抗变幻莫测的计算机病毒,反病毒技术也随之发展起来。目前已经存在多种先进的反病毒技术,如虚拟机技术、启发
人类从当前“以设备为中心”的时代,已经进入了“以服务为中心的时代”。现在,“云”正成为IT业界关注的焦点。Hadoop是Apache开源组织的一个分布式计算开源框架,它受到最先
非刚体运动重建,是计算机视觉领域的热点研究课题。该技术主要研究如何从二维动态视频序列中恢复非刚体对象的三维结构和摄像机运动的相关参数。该技术可以广泛应用于机器人视
P2P是近年来互联网最热门的技术,在VoIP、下载、流媒体、协调计算等领域得到飞速发展,被财富杂志评为影响互联网的四大科技之一。P2P技术体现了互联网最根本的内涵——自由和