ARIMA模型在教育预测中的应用

来源 :经济研究导刊 | 被引量 : 0次 | 上传用户:qqqqq770627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:基于时间序列数据的教育预测方法较多,主要有趋势外推法、人口离散预测模型、生命表法、灰色预测法、线性回归模型、分布滞后模型、Logistic模型、人工神经网络方法等,对一些代表性的方法作了简单的概括,在此基础上,通过构建ARIMA模型拟合湖南中等职业教育的发展趋势,对湖南2007—2011年中等职业教育发展规模进行客观预测。
  关键词:职业教育;教育预测;ARIMA模型
  中图分类号:G40-03文献标志码:A文章编号:1673-291X(2008)06-0189-02
  
  一、文献综述
  
  基于时间序列数据的教育预测方法较多,主要有趋势外推法、人口离散预测模型、生命表法、灰色预测法、线性回归模型、分布滞后模型、Logistic模型、人工神经网络方法等。下面对这些代表性文献予以简单的概括。
  曹志祥、高书国(2004)以全国及城乡全部0~17岁人口为高中阶段教育发展预测的基数,采取低预测、中预测和高预测三种方法,从普通高中阶段教育入学率的40%左右到85%之间,以每5个百分点为界对在校生规模进行具体预测,从而得到不同入学率下的2003—2020年全国高中阶段教育招生规模[1]。
  李霞、刘家壮(2004)以基础教育发展为研究对象,在应用新增人口的离散预测模型基础上,分别建立了小学和初中招生数、分年级在校生规模、在校生总量、专任教师需求和补充规模的预测模型。
  王金营、王绍杰(2006)根据2000年河北省人口普查资料构造出河北省教育生命表。在对2000年河北省教育状况作出合理分析的基础上,对未来20年内河北省各教育阶段升学率作出了高中低三种方案的设计
  马守春(2006)根据1997—2003年西藏自治区人口出生数,建立GM模型用于预测若干年内新出生人数,并分别建立了基础教育阶段在校生总量和分年级在校生的预测模型。
  谢作栩、黄荣坦(2000)以20世纪下半叶我国高等教育学生数和高等教育毛入学率的波动为研究对象,主要采用线性回归分析方法考察高等教育规模扩张过程的发展趋势,得到中国高等教育毛入学率的增长趋势方程,并外推出今后10年高等教育规模的发展趋势[2]。
  邱雅(2005)运用带有自回归项的分布滞后模型对我国高中教育发展规模进行计量预测与分析。这种预测采用逐步推算的方法,分五个步骤进行:首先预测小学毕业生数;由小学毕业生数预测初中招生数;由初中招生数预测初中毕业生数;由初中毕业生数预测职前高中招生数;由职前高中招生数预测职前高中的规模[3]。
  苗红、李全生、吴建伟(2004)采用logistic方程作为高等教育发展规模预测模型,根据时间序列回归确定模型参数,对1980—2002年的历史数据进行了拟合,并对高校在校生人口的比重进行了短期和长期预测[4]。
  刘迎春(2005)运用MATLAB神经网络工具箱的线性网络模型对上海市1980年至今的职业教育规模进行了分析,并比较了不同的输入向量个数、不同训练样本个数对预测结果的影响[5]。虽然线性网络能够在保证误差平方和最小的意义下逼近非线性问题,但它却不能够无误差地解决非线性问题。该方法还要求数据量足够多,这样预测的值就越精确。
  从上述分析我们可以看出,不同的预测方法其建模思想、前提条件是不同的,对于教育预测而言,我们应该选择预测精度高、模型形式相对简单的方法。本文中我们将选用ARIMA模型,这是被普遍称之为博克斯——詹金斯(BJ)方法论的新预测方法,在“让数据自己说话”的哲理的指引下,着重于分析经济时间序列本身的概率或随机性质,而不在意于构造单一方程抑或联立方程模型。该方法既不需要设定一些关键参数(或变量),也不需要在预测最终变量之前先对模型中的相关变量作预测,因而能够降低预测的误差。
  
  二、ARIMA模型的构建
  
  为了构建ARIMA模型以预测湖南中等职业教育发展趋势,我们选取了中职在校生数(zxsrs)作为湖南中等职业教育发展规模的观测指标。通过搜集1978—2006年湖南中职在校生数的统计数据,运用Eviews3.1软件,我们做出了1978—2006年湖南中职在校生数的折线图。从图形上看,中职在校生数带有明显的时间趋势,应该为非平稳序列。因此,我们对中职在校生数(zxsrs)做单位根检验,检验式中包括截距项,所得检验结果如表1所示,相应的检验式为:
  
  (0.3080)
  表1给出了检验结果(ADF=0.3080)。很明显,该值比三个给定的临界值都大,可见中职在校生数(zxsrs)是一个非平稳序列。这样一来,我们就应该继续对中职在校生数(zxsrs)的一阶差分序列进行单位根检验。检验结果如表2所示:
  从表2可知,ADF=-4.3325,小于不同检验水平的临界值,可见中职在校生数(zxsrs)的一阶差分序列?驻zxsrst是一个平稳序列。因此zxsrst,~I(1),为一阶单整序列,可以用ARIMA模型来模拟其变化规律。
  首先观察自相关系数和偏相关系数的图形,可以看出,序列的自相关系数是拖尾的,偏相关系数在5阶截尾,由此可以判断序列基本满足AR(5)过程。通过ARIMA建模发现,AR(1)、AR(2)、AR(3)、AR(4)的系数均没有显著性,因此,剔除这四项继续估计,所得估计结果如表3所示:
  对应的模型表达式是:
  D(ZXSRS)= 2.6073 + [AR(5)=-0.5022](2)
  Se=(0.7375) (0.2329)
  t=(3.5352) (-2.1567)
  R2=0.1813
  为了判断模型(2)是不是对数据的一个良好的拟合,一种简易的诊断是求出模型(2)中的残差并计算这些残差的自相关(ACF)和偏相关(PACF)。残差序列的自相关图和偏相关图右侧给出相对于每一个滞后期的自相关系数和偏相关系数值。我们发现,没有任何自相关和偏相关是个别地在统计上显著的。最右侧Prob列中的数字表示相应自由度条件下统计量取值大于相应Q值的概率。因为这一列概率值都大于0.05,说明所有的Q值都小于检验水平为0.05的分布临界值。自相关和偏相关的相关图表明,从模型(2)估计出来的随机误差序列是一个白噪声序列,我们没有必要再去寻觅其他的ARIMA模型了。
  
  三、模型评价及预测
  
  在利用模型(2)进行预测之前,我们需要对模型的预测功能进行评价。通常的做法是将整个样本区间分成两个部分,用前一段数据估计模型,然后利用所估计的模型对余下的数据点进行预测。一般是用85%~90%的数据进行估计,剩余的数据进行检验。通过实际值和预测值的对比,评价模型的预测功能。因此,我们先用1978—2003年湖南中职在校生数建立模型,对2004—2006年湖南中职在校生数进行预测,然后用2004—2006年湖南中职在校生数的实际值作为检验性数据,考察实际值与预测值之间的偏差。模型估计结果为:
  D(ZXSRS)=2.5781+[AR(5)=-0.4922](3)
  Se=(0.8484)(0.2848)
  t=(3.0389)(-1.7286)
  R2=0.1424
  利用模型(3)我们可以求出2004—2006年湖南中职在校生数的预测值。将这些预测值的点连成曲线,与实际值的折线图对比。从图中我们发现,2004—2006年的实际值与预测值几乎是重叠的,表明模型具有较好的预测能力。因此,我们可以依据模型(2)及1978—2006年湖南中职在校生数的实际值来预测2007—2011年的湖南中职在校生数,预测的结果如表4所示:
  
  参考文献:
  [1]曹志祥,高书国.全国高中阶段教育发展预测[J].基础教育参考,2004,(10):8-11.
  [2]谢作栩,黄荣坦.20世纪下半叶中国高等教育规模发展波动研究——兼21世纪初高等教育发展预测[J].教育研究,2000,
  (10):15-27.
  [3]邱雅.我国高中教育发展规模的计量预测与分析[J].教育与经济,2005,(2):48-53.
  [4]苗红,李全生,吴建伟.我国高等教育发展规模的分析与预测[J].中国地质大学学报:社会科学版,2004,(3):75-77.
  [5]刘迎春.中等职业教育规模的神经网络预测[J].系统仿真技术,2005,(3):158-163.
其他文献
摘要:我国房地产以20%的高发展速度持续增长七年,中国房地产“泡沫说”受到关注选取1987—2005年我国GDPFDI和房地产销售年平均价格的时序数据,利用误差修正模型对三者关系进行计量分析,得出协整关系的结论定量结果表明,GDPFDI对房地产价格有正向的推动作用,但GDP是主要影响因素这个结果基本排除了境外“热钱”对房地产市场的冲击威胁假说,对政策制定有积极意义  关键词:误差修正模型;协整;G
期刊
摘要,从1998年到2004年,我国实行积极财政政策和稳健型货币政策,对经济增长起到了巨大作用,但近年来,结构性通货膨胀出现,政策需要调整作为与我国国情类似的印度,其财政货币政策有着自己的特点,特别自1991年改革后,加大了调整的力度,通货膨胀一直处于较低水平通过研究改革后的印度财政货币政策的有效性,作为供我国财政货币政策调整借鉴的他山之石根据协整理论误差修正模型(ECM)与格兰杰因果检验,验证了
期刊
摘要:新农村建设一直是我国各界关注的焦点。国内学者对新农村经济建设的见解也不尽相同。基于此,利用湖南省2002年投入产出表对湖南省农业与其他产业部门进行了关联性分析,得出湖南省各产业部门中与农业有直接或完全关联的产业部门数量少,一些重要的部门,如金融保险业、综合技术服务业等与农业的关联性较弱,同时,在关联性分析的基础上提出了促进湖南农村经济发展的政策建议。  关键词:关联性效应;新农村;经济增长 
期刊
摘要:从早期的关于金融功能的相关理论,诸如金融深化论、金融抑制论,直到现代金融效率观以及最适金融结构论,学术界对于金融功能的认识不断深化。新金融效率观给予我们一个全新的视角,更科学地去重新审视融资机制问题,从而为促进金融效率的量化研究和最终金融可持续发展指标体系的健全提供了一个理论依据。  关键词:金融深化论;金融抑制论;金融效率  中图分类号:F830文献标志码:A文章编号:1673-291X(
期刊
摘要:民法学界对侵权归责原则之“责”理解不一,其实质是对“民事责任”与“民事义务”两个民法概念以及物权保护方法与债权保护方法如何进行区分和理解的问题。《物权法》对民事责任形式采取了概括规定,这就导致了一些学者认为侵权归责原则之“责”除损害赔偿外尚囊括排除妨害、消除危险等责任形式。实质上,在理清有关概念和理论后,容易疏导出侵权归责原则之“责”仅与损害赔偿有关。即使在大陆法系和英美法系国家的立法规定中
期刊
摘要:社会主义新农村建设是一项长期而又艰巨的任务,许多地区在建设新农村过程中都根据自身的条件和优势走上了发展乡村旅游的道路。石榴红村通过自身的努力探索出了一条正确的发展道路。但是,由于受自身资源等条件的限制,该村目前的发展仍存在一些亟待解决的问题。其他地区可以借鉴石榴红村的一些成功经验,如政府引导、建设资金筹集的“四结合”模式等,但在具体实施的过程中,应当根据各地的实际情况,因地制宜。  关键词:
期刊
摘要:国内外所有关于财务危机预警问题的研究,主要涉及到两个方面的问题:一是财务危机概念的界定;二是预测变量(判别指标)的选择和预警模型的建立(企业财务危机是一个连续的动态过程,并直接表现为绩效指标的恶化,因此,可通过一定的财务指标来构造企业的财务预警模型)。运用中国上市公司的财务指标数据及因子分析和Logistic回归等方法构建基于上市公司的财务危机预警的Logistic模型,经过检验,具有一定的
期刊
摘要:旧城历史文化改造区型旅游商业区(RBD)是我国主要的四种城市RBD之一。但是近年来,很多旧城历史文化改造区型RBD呈现出衰落的趋势。通过对形象吸引力、活动吸引力、设施吸引力、景观与环境吸引力及氛围吸引力等方面进行重新塑造能够促使其复兴或更新。  关键词:旧城历史文化改造区;旅游商业区(RBD);吸引力  中图分类号:F592.1文献标志码:A文章编号:1673-291X(2008)06-01
期刊
摘要:私小说在日本近代文坛占主流地位,在日本几乎所有的近现代作家都创作过私小说,而探究私小说中封闭的自我环境的成因是研究私小说的主要途径。从真实性、传统性、封闭性、社会性四个方面进行研究有助于全面阐述封闭的自我环境的成因,进而深入剖析私小说中自白的人性。  关键词:私小说;“自我”性;封闭性;真实性;社会性  中图分类号:文献标志码:A文章编号:1673-291X(2008)06-0173-02 
期刊
摘要:近年来,上海的经济持续快速发展,人民生活水平普遍快速提高,但上海面临的人口加速老龄化、老年人口加速高龄化,使老年人口数量大大增加。对上海市杨浦区2004—2005年间老年人口的经济状况及其变化趋势研究,认为老年人的经济状况不容乐观,老年人的经济状况变得更加严峻。  关键词:杨浦区;老年人口;经济状况;经济困难老人  中图分类号:F127文献标志码:A文章编号:1673-291X(2008)0
期刊