论文部分内容阅读
摘 要:本文主要利用时间序列模型对沪深300指数和沪深300股指期货当月合约(IF00)的基差进行分析和研究,主要包括以下内容:第一,对基差数据进行预处理,并对其进行初步检验(ADF检验等);第二,利用平稳时间序列模型(ARIMA模型)进行建模,并确定模型的阶数;第三,利用极大似然估计,计算模型的参数并最终建立模型;第四,对模型的残差项进行检验,并利用波动率模型进行分析和处理;第五,利用建立的基差模型对未来的基差的变化进行预测。
关键词:基差 ARIMA模型 GARCH模型
一、引言
在最近几个月,中国股市和股指期货市场大幅震荡,同时也导致股指期货基差发生剧烈波动。同时沪深300股指期货的基差也震荡剧烈。基差的剧烈变化一方面为股指期货的投资者提供了套利空间,另一方面也为使用股指期货对冲风险的投资者增加了对冲成本。因此,对股指期货的基差变化进行研究具有重要意义。本文以沪深300指数和沪深300股指期货当月合约(IF00)为例,对股指期货基差的变化进行探索,主要包括:第一,对基差数据进行预处理,并对其进行初步检验;第二,利用平稳时间序列模型进行建模,并确定模型的阶数;第三,利用极大似然估计,计算模型的参数并最终建立模型;第四,对模型的残差项进行检验,并利用波动率模型进行分析和处理;第五,利用建立的基差模型对未来的基差的变化进行预测。希望通过上述的研究,能够了解沪深300股指期货稽查的变化规律。
二、数据预处理及初步检验
1.数据的预处理。本文主要采用沪深300指数和沪深300股指期货当月合约(IF00)从2013年1月到2015年12月的分钟数据进行研究,数据来源于Wind。在本文中,基差等于指数每分钟的收盘价减去股指期货当月合约每分钟的收盘价。沪深300股指股指期货的基差开始发生明显的剧烈波动,在2015年的七八月份,基差甚至达到了300点,波动异常剧烈。
2.数据的初步检验。在建立模型前,需对沪深300股指期货基差数据进行初步检验,包括自相关性检验和单位根检验。
2.1自相关性检验。首先对基数数据进行自相关性检验,以判断基数数据是否是白噪声。对此,我们采用Ljung-Box统计量来进行检验,以判断其样本自相关系数是否为0。经过检验,沪深300股指期货基差数据之间存在明显的自相关性。因此,我们可以考虑使用ARIMA模型来建模,对基差数据进行更深入的研究。
2.2单位根检验。在建立模型之前,我们首先对基差数据进行单位根检验,已检验稽查数据的平衡性,本文中主要采用ADF检验以确定基差数据是否存在单位根。经检验之后我们得到, P值为0.01,所以不存在单位根,即基差数据是平稳的时间序列。因此,我们采用ARMA模型来详细刻画基差数据,并对其进行更深入的研究和分析。下面我们来确定ARMA模型的阶数。
三、ARMA模型定阶
前面我们通过ADF检验确定了基差数据是平稳的时间序列。因此,我们采用ARMA模型对基差序列进行刻画。首先,确定ARMA模型的阶数。一般有两种方法:基本分析法和信息准则法。
1.基本分析法。基本分析法是一种比较粗糙的模型定阶方法。对于ARMA模型,我们主要依靠分析基差序列的样本自相关函数(ACF)和样本偏自相关函数(PACF)是否截尾来确定ARMA模型的阶数P和q。经计算,我们可依次得到基差序列的ACF和PACF,從基差序列的ACF和PACF图形中,我们可以看出:差序列的ACF不截尾,基差序列的PACF在8阶以后截尾。因此,此时ARMA模型下降为单纯的AR模型,且阶数为8,即所谓的AR(8)模型。
2.信息准则法。另外一种更为精确的定阶方法是使用信息准则来确定ARMA模型的阶数。在确定ARMA模型的阶数时,我们可采用枚举法来进行计算:让p=0,1,2,…,50 q=0,1,2,…,50,分别计算出此时模型的信息准则AIC,通过确定最小的信息准则AIC,此时的阶数P和q即为ARMA模型中最优的P和q。上述说明可看出信息准则法虽然比较精确,但计算量比较大,且当P和q大于10以后,求解信息准则AIC变得非常困难,因此本文中不详细使用信息准则法来确定模型阶数。
四、基差序列的AR模型
本文中采用基本信息法来确定模型的阶数,即基差序列模型服从AR(8)模型,我们以AR(8)模型为基础建立基差序列的模型。
在AR模型中,时间序列服从
其中,为模型的参数,为白噪声序列。我们采用极大似然估计来确定模型的参数,即为AR(8)模型的参数以及AIC等指标。此时模型的信息准则AIC为960545.7,相比于其他的模型阶数p和q,模型的信息准则AIC变化不大,因此基本分析法估计的阶数可以接受。下面我们将对上述模型的残差项进行分析,以确定模型拟合的准确性。
五、模型检验
本章中我们将对模型的准确度进行检验,主要是通过对模型的残差项进行检验,从而确定模型的准确度。
1.残差序列的检验。在前面我们对基差序列建立了AR(8)模型,下面我们对模型的残差项进行分析,残差项的均值为7.129379e-04,标准差为3.709309e+00,由此结果看模型拟合的效果可以令人满意。但同时我们也发现,个别残差项的偏离0,因此模型人需进一步的修正。下面我们检验残差项和残差项平方的自相关性,从残差序列的样本自相关函数(ACF)结果可看出,虽然个别阶数的样本自相关系数比较大,但总体而言,残差序列的样本相关性比较低,可以认为残差序列之间是独立的;从残差平方序列的样本自相关函数(ACF)结果可看出,残差平方序列具有明显的自相关性,即残差有明显的ARCH效应(条件异方差性)。因此,下面我们使用LARCH模型来对残差序列进行刻画。
2.残差序列的GARCH模型。下面我们使用GARCH (1,1)来刻画残差序列,即:
利用残差序列对GARCH模型进行拟合,可得到GARCH模型的参数均显著不为0,因此模型的拟合效果较好。下面我们来对GARCH模型的残差进行ARCH效应检验,我们GARCH模型残得到差项没有明显的条件异方差性。因此,我们可以采用上述的GARCH模型来进一步刻画基差序列AR(8)模型的残差序列,通过这两个模型的结合,我们可以更好的刻画沪深300股指期货基差序列随时间的变化。
六、模型的预测
在前面的章节中,我们通过AR(8)模型和GARCH(1,1)模型较好地刻画了沪深300股指期货基差序列随时间的变化。本节中,我们将利用前面的模型来预测沪深300股指期货基差序列未来随时间的变化。在预测沪深300股指期货基差序列未来随时间的变化时,主要分为两步:首先,利用AR模型来对基差序列均值的未来变化进行预测,刻画其未来的大致变化趋势;其次,利用GARCH模型来对基差序列的未来波动率变化进行预测,利用均值加减1.96倍波动率来简单刻画出未来一段时间基差序列的波动范围。我们利用Wind中的数据刻画模型,对沪深300股指期货基差序列在2016年第一个交易周的表现进行预测,与实际数据相比,虽然模型的预测并不是完全准确,但总体而言,模型的预测效果相当不错。
七、结语
本文主要研究了沪深300股指期货基差序列随时间变化的情况。文中主要通过ARMA模型和GARCH模型分别刻画了沪深300股指期货基差序列随时间的变化趋势及其波动率随时间变化的趋势,并且对未来基差序列的变化进行预测,得到了不错的效果。在对沪深300股指期货基差序列研究过程中,还有许多问题需要解决。例如:如何利用信息准则来更好的判定ARMA模型的阶数,如何进一步减少残差项的相关性,如何能够更加准确的预测出未来一天基差序列的变化范围。
作者简介:赵小雨(1991.12—)女。籍贯:湖北省荆门市。学历:硕士研究生。专业:金融。
关键词:基差 ARIMA模型 GARCH模型
一、引言
在最近几个月,中国股市和股指期货市场大幅震荡,同时也导致股指期货基差发生剧烈波动。同时沪深300股指期货的基差也震荡剧烈。基差的剧烈变化一方面为股指期货的投资者提供了套利空间,另一方面也为使用股指期货对冲风险的投资者增加了对冲成本。因此,对股指期货的基差变化进行研究具有重要意义。本文以沪深300指数和沪深300股指期货当月合约(IF00)为例,对股指期货基差的变化进行探索,主要包括:第一,对基差数据进行预处理,并对其进行初步检验;第二,利用平稳时间序列模型进行建模,并确定模型的阶数;第三,利用极大似然估计,计算模型的参数并最终建立模型;第四,对模型的残差项进行检验,并利用波动率模型进行分析和处理;第五,利用建立的基差模型对未来的基差的变化进行预测。希望通过上述的研究,能够了解沪深300股指期货稽查的变化规律。
二、数据预处理及初步检验
1.数据的预处理。本文主要采用沪深300指数和沪深300股指期货当月合约(IF00)从2013年1月到2015年12月的分钟数据进行研究,数据来源于Wind。在本文中,基差等于指数每分钟的收盘价减去股指期货当月合约每分钟的收盘价。沪深300股指股指期货的基差开始发生明显的剧烈波动,在2015年的七八月份,基差甚至达到了300点,波动异常剧烈。
2.数据的初步检验。在建立模型前,需对沪深300股指期货基差数据进行初步检验,包括自相关性检验和单位根检验。
2.1自相关性检验。首先对基数数据进行自相关性检验,以判断基数数据是否是白噪声。对此,我们采用Ljung-Box统计量来进行检验,以判断其样本自相关系数是否为0。经过检验,沪深300股指期货基差数据之间存在明显的自相关性。因此,我们可以考虑使用ARIMA模型来建模,对基差数据进行更深入的研究。
2.2单位根检验。在建立模型之前,我们首先对基差数据进行单位根检验,已检验稽查数据的平衡性,本文中主要采用ADF检验以确定基差数据是否存在单位根。经检验之后我们得到, P值为0.01,所以不存在单位根,即基差数据是平稳的时间序列。因此,我们采用ARMA模型来详细刻画基差数据,并对其进行更深入的研究和分析。下面我们来确定ARMA模型的阶数。
三、ARMA模型定阶
前面我们通过ADF检验确定了基差数据是平稳的时间序列。因此,我们采用ARMA模型对基差序列进行刻画。首先,确定ARMA模型的阶数。一般有两种方法:基本分析法和信息准则法。
1.基本分析法。基本分析法是一种比较粗糙的模型定阶方法。对于ARMA模型,我们主要依靠分析基差序列的样本自相关函数(ACF)和样本偏自相关函数(PACF)是否截尾来确定ARMA模型的阶数P和q。经计算,我们可依次得到基差序列的ACF和PACF,從基差序列的ACF和PACF图形中,我们可以看出:差序列的ACF不截尾,基差序列的PACF在8阶以后截尾。因此,此时ARMA模型下降为单纯的AR模型,且阶数为8,即所谓的AR(8)模型。
2.信息准则法。另外一种更为精确的定阶方法是使用信息准则来确定ARMA模型的阶数。在确定ARMA模型的阶数时,我们可采用枚举法来进行计算:让p=0,1,2,…,50 q=0,1,2,…,50,分别计算出此时模型的信息准则AIC,通过确定最小的信息准则AIC,此时的阶数P和q即为ARMA模型中最优的P和q。上述说明可看出信息准则法虽然比较精确,但计算量比较大,且当P和q大于10以后,求解信息准则AIC变得非常困难,因此本文中不详细使用信息准则法来确定模型阶数。
四、基差序列的AR模型
本文中采用基本信息法来确定模型的阶数,即基差序列模型服从AR(8)模型,我们以AR(8)模型为基础建立基差序列的模型。
在AR模型中,时间序列服从
其中,为模型的参数,为白噪声序列。我们采用极大似然估计来确定模型的参数,即为AR(8)模型的参数以及AIC等指标。此时模型的信息准则AIC为960545.7,相比于其他的模型阶数p和q,模型的信息准则AIC变化不大,因此基本分析法估计的阶数可以接受。下面我们将对上述模型的残差项进行分析,以确定模型拟合的准确性。
五、模型检验
本章中我们将对模型的准确度进行检验,主要是通过对模型的残差项进行检验,从而确定模型的准确度。
1.残差序列的检验。在前面我们对基差序列建立了AR(8)模型,下面我们对模型的残差项进行分析,残差项的均值为7.129379e-04,标准差为3.709309e+00,由此结果看模型拟合的效果可以令人满意。但同时我们也发现,个别残差项的偏离0,因此模型人需进一步的修正。下面我们检验残差项和残差项平方的自相关性,从残差序列的样本自相关函数(ACF)结果可看出,虽然个别阶数的样本自相关系数比较大,但总体而言,残差序列的样本相关性比较低,可以认为残差序列之间是独立的;从残差平方序列的样本自相关函数(ACF)结果可看出,残差平方序列具有明显的自相关性,即残差有明显的ARCH效应(条件异方差性)。因此,下面我们使用LARCH模型来对残差序列进行刻画。
2.残差序列的GARCH模型。下面我们使用GARCH (1,1)来刻画残差序列,即:
利用残差序列对GARCH模型进行拟合,可得到GARCH模型的参数均显著不为0,因此模型的拟合效果较好。下面我们来对GARCH模型的残差进行ARCH效应检验,我们GARCH模型残得到差项没有明显的条件异方差性。因此,我们可以采用上述的GARCH模型来进一步刻画基差序列AR(8)模型的残差序列,通过这两个模型的结合,我们可以更好的刻画沪深300股指期货基差序列随时间的变化。
六、模型的预测
在前面的章节中,我们通过AR(8)模型和GARCH(1,1)模型较好地刻画了沪深300股指期货基差序列随时间的变化。本节中,我们将利用前面的模型来预测沪深300股指期货基差序列未来随时间的变化。在预测沪深300股指期货基差序列未来随时间的变化时,主要分为两步:首先,利用AR模型来对基差序列均值的未来变化进行预测,刻画其未来的大致变化趋势;其次,利用GARCH模型来对基差序列的未来波动率变化进行预测,利用均值加减1.96倍波动率来简单刻画出未来一段时间基差序列的波动范围。我们利用Wind中的数据刻画模型,对沪深300股指期货基差序列在2016年第一个交易周的表现进行预测,与实际数据相比,虽然模型的预测并不是完全准确,但总体而言,模型的预测效果相当不错。
七、结语
本文主要研究了沪深300股指期货基差序列随时间变化的情况。文中主要通过ARMA模型和GARCH模型分别刻画了沪深300股指期货基差序列随时间的变化趋势及其波动率随时间变化的趋势,并且对未来基差序列的变化进行预测,得到了不错的效果。在对沪深300股指期货基差序列研究过程中,还有许多问题需要解决。例如:如何利用信息准则来更好的判定ARMA模型的阶数,如何进一步减少残差项的相关性,如何能够更加准确的预测出未来一天基差序列的变化范围。
作者简介:赵小雨(1991.12—)女。籍贯:湖北省荆门市。学历:硕士研究生。专业:金融。