数据挖掘技术在股票分析预测中的应用研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:jacky1313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的快速发展,各个领域堆积的数据也越来越多。数据库虽然有着很强大的采集数据和存储数据的能力,但是数据分析能力却相对薄弱。无法挖掘到隐藏在海量数据背后的信息,导致数据爆炸和知识匮乏的普遍现象。如何从海量的数据中提取有用的知识成为当务之急,数据挖掘也正成为当今信息技术的一个重要研究内容。   我国的证券市场从上个世纪90年代起步,到现在已经经历了几十年的发展壮大,各个证券公司都积累了海量的历史数据,如何对这些数据进行有效的处理,成为证券市场发展的一个难题。同时,证券业中的很多业务都需要对历史数据进行处理后才能展开,数据挖掘技术的诞生为海量数据的处理提供了有效的方法。通过对历史数据的加工处理,挖掘历史数据中隐藏着的有价值信息,为证券公司和股票投资者提供参考意见。   本文阐述了数据挖掘的基本概念,并对数据挖掘中的分类技术进行了深入分析,主要研究分析了经典的决策树算法、自组织特征映射图(SOM网络)、K-means聚类算法。   本文的主要工作有以下三点:   (1)把经典的决策树算法应用到股票历史数据分析中,通过对历史数据的分析,建立了股票价格走势决策树预测模型。经过对测试数据的测试,实验结果是可以达到指导投资者进行股票投资的目的。   (2)具体的分析了SOM网络与K-means算法的特点,并根据SOM网络与K-means算法的各自缺点建立了基于SOM&K-means混合聚类算法。通过对数据的训练与测试,最终得到的聚类结果明显优于单独的SOM网络和K-means算法。   (3)在SOM&K-means混合聚类算法的基础上,提出了基于SOM&K-means混合聚类的交易规则。把此交易规则应用到沪深300指数走势的预测中,最后通过与B&H策略和Resta的R1,R2,R3交易规则在统计指标和经济指标上的比较,得出在band等于0的情况下,基于SOM&K-means混合聚类的交易规则在统计指标和经济指标上要优于B&H策略和Resta的R1,R2,R3交易规则。   本文的创新:在决策树应用中,根据股票走势的特殊性,提出了一种特殊的剪枝方法,得到了比较满意的决策树预测模型;在股票投资预测中引入了SOM&K-means混合聚类方法,并在混合聚类的基础上提出了基于SOM&K-means混合聚类的交易规则。
其他文献
量子遗传算法是新发展起来的一种概率演化算法,其优点是种群规模小,全局搜索能力强和收敛速度快。然而,量子遗传算法在解决复杂优化问题时的能力不是很强。为了提高量子遗传算法
随着信息时代的快速发展,信息的获取极其方便、快捷和全面。但是由于信息爆炸,又很难在海量信息中找到切实可用的信息。在教学方面,传统课件封闭固定,没有学生的参与,缺乏灵
随着数据信息化的飞速发展,数据已经成为当今各个领域的重要资源。数据信息的安全与否关系着企业的生存与发展,因此保证数据安全的远程数据容灾方案成为当前数据存储和数据安全
随着移动通信技术的不断发展,3G(3rd-generation)网络技术也越来越成熟,3G网络的用户数量也逐渐增多。3G网络是一个公开的网络,同时拥有数量庞大的用户群,对于信息隐藏的研究来
随着计算机网络和图形图像学的迅速发展,传统的基于文本的图像检索技术已经无法满足用户日益复杂的检索需求,所以基于内容的图像检索(Content-Based Image Retrieval,简称CBI
近年来,电子商务在全球经济中发挥了越来越重要的作用。而在众多的电子商务模式中,企业对消费者(B2C)模式越来越显示出其的巨大潜力。随着互联网的不断发展,网络上的信息量也在
基于SPH方法的流体模拟是将问题域化为一系列携带某一特定材料属性的粒子,利用每个粒子的运动确定整体的运动形态。而所有粒子的运动都可以通过其支持域内的全部粒子的运动属
近年来,随着互联网信息技术的迅速发展,互联网上的信息资源已经达到海量级别,并且正呈指数级形式增长,海量网页数据的结构复杂性和用户查询词简短及语义模糊性等特点给现有搜索
本文将GIS的空间分析功能应用于无线传感器网络的汇聚节点与特征点的选取以及网络布设过程中,将动态地理路由算法应用于普通无线传感器节点向汇聚节点传送数据的路由选择过程,
随着无线通信技术的迅猛发展,可用的频谱资源变得越来越紧张,尤其是随着无线局域网、无线个域网和无线城域网等技术的高速发展,目前的宽带无线应用技术已无法满足人们的需求