论文部分内容阅读
变系数回归模型是一般线性回归模型的一个推广,允许回归系数是某个(些)协变量的函数。它像线性回归模型一样容易解释,同时也像非参数模型一样灵活,还避免了纯粹的非参数回归模型具有的“维数祸根”的缺点。因此自从上世纪九十年代被提出以来,变系数回归模型就一直受到统计学家、经济学家和其他领域专家学者的重视,但目前对变系数回归模型的研究几乎都集中在误差是独立的前提假设之下。在实际应用中,观测到的数据是时间序列时,独立误差的假设往往不成立。本文主要研究当误差序列存在相关性时,特别是一个自回归过程时,变系数回归模型的统计推断问题。首先忽略误差的自回归结构,运用局部多项式方法对变系数回归模型进行初始估计,估计残差,并证明了未知系数函数的初始估计量的渐近正态性和一致收敛速度。在此基础上,我们提出应用SCAD惩罚Yule-Walker方程来拟合自回归误差过程,给出了算法,包括如何选择调整参数λ和窗宽h。该方法与一般的变量选择方法不同,能同时确定自回归误差的阶数和有效估计自回归误差的系数。SCAD方法还具有Oracle性质,即由该方法得到的自回归误差系数估计与自回归误差阶数完全已知时得到的自回归误差系数估计是完全等价的。根据拟合的自回归误差结构,我们进一步提出了一个预先漂白的回归系数函数的局部多项式估计,导出了它的渐近正态性,证明了它比忽略误差自回归结构的起始估计更有效,即存在更小的渐近方差,同时也不会增加偏度。运用蒙特卡洛模拟,我们研究了SCAD惩罚的局部多项式估计的有限样本行为。重复试验结果显示,在各种情况下基于SCAD惩罚的局部多项式估计都明显比忽略误差结构的起始估计效果好,且优于假设误差是具有起始阶数的自回归过程的PLS估计,而与误差结构完全已知时的Oracle估计的差距非常小;随着样本量的增大或者误差方差的减小,四种方法的估计效果都变得更好;SCAD方法的定阶效果较好,样本量较大时,正确率均在85%以上;且具有稳健性,即使在误差满足独立假设的情况下,定阶正确率仍保持在65%左右。最后我们还将得到的理论结果应用于实证分析。首先研究的是我国时变弹性系数生产函数,运用SCAD方法对误差结构定阶并估计自回归误差结构的自回归系数,验证了误差满足独立假设。实证结果显示,在1981年到2009年期间,中国的资本和劳动产出弹性都是时间的非线性函数,资本输出弹性在0.2161到0.7349之间,1995年到1998年间有下降趋势,2002年达到最大值;劳动输出弹性在0.3421至0.8987之间,2002年处于最低点,2002年到2004年间迅速增长;规模报酬则在0.8837至1.1148之间。另一实证分析研究的是影响我国大豆期货价格的因素。从市场供求角度分析,本文选取了豆粕期货价格、豆油期货价格和美国进口大豆价格这三个解释变量。基于SCAD方法的拟合结果显示误差序列一阶自回归过程,经过预先漂白的残差序列满足独立的假设,SCAD惩罚最小二乘估计的效果也比假设误差独立的起始估计有所改进。实证结果显示,豆粕期货对大豆期货价格的影响,起初相对平稳,影响力有较小起伏,在2010年10月以后呈递减趋势;豆油期货与豆粕相反,起初相对平稳,在2010年9月20日达到最小值,之后有明显递增趋势;美国进口大豆价格对大豆期货定价的影响力相比豆粕和豆油而言较小,在2010年3月29日和9月15日达到两个小高峰,同样在2010年10月以后呈递减趋势。