论文部分内容阅读
支持向量机(Support Vector Machines,简称SVMs)是建立在统计学习理论的VC(Vapnik-Chervonenkis)维理论和结构风险最小化原理基础上的一种机器学习方法。支持向量机在解决实际应用中的小样本问题时具有较大的优势,较好地解决了以往困扰很多学习方法的小样本、非线性、过学习、高维数、局部极小点等实际问题。如果仅从分类的角度来说,支持向量机是一种广义的线性分类器,它是在线性分类器的基础上,引入结构风险最小化原理、最优化理论和核函数方法深化而成的。当前基于支持向量机的模型得到了越来越多的重视和应用。但由于支持向量机最初是针对二分类问题提出的,因此如何将其推广到多类分类问题上就是一个很值得深入研究的问题。
聚类分析方法是一种被广泛应用的且很有效的分类方法,它是利用多元统计分析的基本原理,对一批样本进行分类处理的数学方法。其基本思路是将一批样本或变量,按照它们在性质上的亲疏程度进行分类,把样本看成是,,l维空间的一个点。在m维坐标中,定义点与点之间的某种距离,通过距离的远近把样本分成若干类别。
因此,本文放弃了以往的只采用聚类分析或支持向量机来分类的方法,在分别介绍了聚类分析和支持向量机分类算法的基础上,采用了聚类分析和支持向量机相结合的方法来解决多类分类问题,并采用这种方法对上市公司的股票进行分类。由于股票数据本身的复杂性,在进行分类之前先采用因子分析的方法对股票数据进行降维简化,从而减少分类时的计算量和程序运行时间。实验证明,这种分类算法有很高的分类正确率,从而说明这种方法是可行的。