论文部分内容阅读
20世纪70年代,Box和Jenkins发表专著《时间序列分析:预测与控制》,介绍了大量时间序列建模、估计和预测的方法。他们的成果为时间序列分析构建了比较系统而完善的理论体系,促进了时间序列分析的蓬勃发展。当前,作为研究社会经济和自然现象的一种重要方法,时间序列分析在金融学、信号处理、无线通信、机械诊断等许多领域都有广泛的应用。
时间序列的短期预测问题是时间序列分析的主要问题之一。比如在证券市场上,预测未来一段时间内的证券价格是广大投资者密切关注的问题。在时间序列建模和预测中,常用的模型有自回归(AR)、滑动平均(MA)、自回归滑动平均(ARMA)模型等。这些传统的模型通常能较好预报平稳序列的结果,但有时无法准确预测非线性时间序列。近年来,基于统计学习理论的支持向量机(SVM)开始应用于非线性时间序列预测。统计学习理论的基本内容诞生于20世纪60年代末,其主要创立者是前苏联科学家Vapnik。20世纪90年代中期,该理论发展成熟并开始受到广泛重视。作为一种研究小样本统计估计和预测的理论,支持向量机采用结构风险最小化原则,着力解决小样本、非线性、高维数等情形下的回归预测问题。
当输入向量含有噪声时,支持向量回归与预测的精确性受到影响。独立成分分析(ICA)是90年代发展起来的一种信号处理技术,它是一种从多维统计数据中找出独立分量的方法,被广泛应用于特征提取、生物医学信号处理、通信系统、图像处理、语音信号处理等领域。本文利用ICA滤去输入向量中的噪声来提高支持向量机的预测精度。
根据记忆性的长短,时间序列可分为长记忆性和短记忆性。相对于时间序列的短期预测,在实际背景中,比如金融经济、通信、气象天文等领域,很多序列具有长记忆性的特征。长记忆性表现为历史事件对未来有着持续影响,序列的相关系数按照双曲率衰减。短记忆性表现为随着时间间隔增大,过去和现在对未来的影响很快衰减并趋于0,相关系数按照指数阶衰减。
当前,时间序列波动的长记忆性研究已经成为国内外金融学研究的热点之一。作为现代金融经济学基石的市场有效假说认为市场是有效的,基于资产的历史价格预测未来价格是不可能的。金融市场长记忆性的存在对市场有效假说是一个重大挑战。如果金融市场存在长记忆性,资产价格变化遵循某种规律,则金融市场的投资者可以通过分析资产价格的历史信息而对其未来变化作出判断。因此,时间序列的长记忆性研究具有重要的理论和实用价值。具体地,许多学者对于中国股市波动是否存在长记忆性尚存有争议。本文基于自相似的思想,利用聚集序列方法实证分析上证指数日收益率的绝对值序列、平方序列、对数平方序列的长记忆性,结果表明上证指数的波动率具有长记忆性。
本文主要讨论基于独立成分分析和支持向量机的时间序列短期预测方法,以及时间序列长记忆性的估计。全篇论文的结构安排如下:
第一章,扼要地介绍了时间序列短期预测和长记忆分析的概况,讨论了国内外的研究现状,阐述了本文的主要工作。
第二章,主要介绍ICA和支持向量回归(SVR)的基本理论。简述了ICA和SVR的一些基础知识,给出了ICA的定义和假设条件;介绍了ICA白化预处理方法和几种常用的ICA算法;介绍了统计学习理论,简要推导了支持向量分类和支持向量回归的数学过程。
第三章,结合支持向量机与独立成分分析,将独立成分分析用于支持向量机的数据预处理。支持向量机采用结构风险最小化原理兼顾训练误差和泛化能力,能较好地解决小样本、非线性、高维数等实际问题,但它的抗噪能力不强。ICA理论是20世纪90年代发展起来的一项新的多维信号分解技术。本章首先介绍了多元非线性回归的模型,简略回顾了ICA和SVR的基本原理,重点阐述了ICA-SVR算法的原理和步骤。仿真实验表明,对于带噪的输入向量,ICA-SVR算法较SVR算法有更小的预测误差,更准确的趋势预测。
第四章,首先介绍了长记忆性的定义,从时域,频域和自相似的角度简要介绍长记忆性的特点。为更好地理解长记忆性,重点从金融的角度分析了长记忆性产生的原因及其理论基础,并阐述了长记忆性在金融学研究中的价值。
第五章,基于自相似的思想,构造聚集序列,通过日收益率的绝对值、平方、对数平方序列来考察上证指数波动率的长记忆性。结果显示,这些序列在显著性水平下具有长记忆性,即上证指数波动率具有长记忆性。上述结果进一步说明中国股票市场还不是有效市场,发展不够充分,许多方面都有待完善。
第六章,总结本文的工作和创新点,并展望进一步的研究。