论文部分内容阅读
本文研究证券数据分类问题。基于K-MEANS、系统聚类算法和SOM神经网络算法,我们提出了一个对数据进行分类的KMHS算法,并应用该算法对上证50指数的成份股票进行了分类,结合实际应用背景解释这种分类结果,效果较为理想。
我们将待分类数据转化为二维表形式,使用K-MEANS算法对数据进行分类。由于K-MEANS算法的结果依赖于聚类个数k的选择和初始聚类中心的确定。本文提出通过对系统聚类过程中产生的统计参数的变化分析来确定聚类个数k;使用SOM神经网络算法来确定初始的聚类中心。通过这两方面的工作,得到一个针对证券数据分类问题的KMHS算法。
在对上证50指数成份股票进行分类时,为了减少数据指标复杂度和增加数据结果展现的直观性,我们使用星座图算法中的坐标变换将高维的数据降维到2维,并使用KMHS算法对其分类,将50支股票分成为6类,并根据分类结果依次分析了这6类成份股票,确定了每一类的特征。