Lasso结构化损失应用于ARMA模型的阶数识别及系数估计的探讨

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:longxue1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自Box和Jenkins(1970)所著的第一本在ARMA框架内讨论系统建立时间序列模型的书起,线性高斯时间序列模型的研究得到极大的发展,而且至今依然由于其简便性、可行性和可解释性在时间序列分析中发挥重要的作用。不过,传统的ARMA模型的估计方法和阶数判别准则都是建立在极大似然估计的基础之上,这就意味着需要已知数据的分布,而实际情况中数据符合何种分布是不能被证明的。且自相关函数和偏相关函数图只能大致识别阶数,当模型同时存在自回归和移动平均效应,或者样本量不大的情况下,不一定能充分识别最长的候选阶数。另外,当备选模型阶数较长的情况下,如果要得到信息准则最小化的最优模型,就意味着庞大的计算量。  因此,为了提供更加快速的计算ARMA模型的可能性,本文研究了将Lasso结构化损失引入ARMA模型的计算中,不要求知道数据的分布.使得系数估计和定阶准则的计算及模型之间的比较“一步化”。已有的对于此问题的研究主要着眼于将Lasso方法用于仅包含自回归部分的((V))AR模型,本文将其扩展到更为普遍的ARMA模型。即探索性的研究如何利用Lasso结构化损失来更加快速的计算ARMA模型。提出用预白化的方法对白噪声部分进行估计,将ARMA模型化为线性的形式,从而可以应用已有的关于线性模型的Lasso算法。而且通过不同形式模型的数据模拟,讨论了Lasso结构化损失用于AR模型在不同样本量的情况下的效果。并且对本文提出将Lasso算法应用于ARMA模型的近似算法进行了验证。  论文共分五个部分:第一章引言分析了论文的研究背景和意义,简要介绍了ARMA模型阶数识别和系数估计的传统解法,以及现有将Lasso方法应用于((V))AR模型的研究进展与结论。第二章回顾了ARMA模型及其传统的阶数识别和参数估计的方法;第三章探讨了将Lasso结构化损失应用于ARMA模型的风险函数的方式,提出通过预白化的方法可以对白噪声部分进行合理的估计,将ARMA模型化为线性的形式,从而可以应用已有的关于线性模型的Lasso算法。还对几种与Lasso结构化损失有关的算法进行了讨论,比较了它们之间的关系。论文的第四章是数据模拟,首先针对不同形式的AR模型,讨论Lasso算法与传统算法的效果。再应用文章第三章提到的预白化处理方法估计ARMA模型的参数,同时进行阶数的选择。第五章总结了数据模拟部分的结论,指出了论文研究中的不足之处,并列出了今后可能的研究方向。  文章分析指出Lasso+Cp算法与传统算法采用AIC准则之间实质上都是通过逐步迭代的方式计算风险最小化时的系数,并且通过一定的准则对模型的复杂度进行惩罚。二者实质上的区别在于迭代方式的不同,当使用LARS方式来解Lasso问题时,算法就变为一种类似于向前逐段回归的方式,而传统方式要比较所有可能模型的AIC的值,可以理解成为采用的是最佳子集选择的方式。因此,Lasso算法的速度更快。而AIC准则对阶数的选择不足相合的,Cp是风险的无偏估计,因此选择AIC还是Cp准则也会对模型最终的估计效果会产生影响。  由数据模拟的结果可以看出:对于AR模型,Lasso+Cp算法与传统算法的结果比较近似,而且在某些特殊情况,如不同滞后期项白回归影响符号不一致,或自回归部分系数的大小随着时间间隔的增加而先增后减,Lasso+Cp算法可能比传统算法得出与真实模型更为接近的解。对于ARMA模型来说,通过预白化的方法,利用Lasso结构化损失并以Cp作为标准可以快速的识别和估计ARMA模型,且结果与采用AIC标准的传统方法基本一致,样本量越大效果越好。不过由于预白化的方法是一种大样本的近似方法,Lasso法可能因为这种近似性而造成对系数估计精度的损失。  本文的创新之处在于:提出了采用预白化处理数据,可以将Lasso算法应用于ARMA模型的阶数识别与参数估计中来;并且针对不同形式的AR和ARMA模型,讨论Lasso算法与传统算法的效果,并对算法的效率进行了一些分析。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
本文探索运用风险平价(risk parity)的方法在中国市场中进行股票投资的可能性。本文将对风险平价的背景和如何确定不同资产的投资比重的方法进行研究。同时,本文将利用A股市
商业银行的本质是经营风险,风险管理能力的高低决定了银行长期经营能力的提高和公司发展目标的实现。本文从一个全新的视角来分析商业银行的风险问题,指出由于银行在公司治理结
为深入贯彻落实科学发展观,提高选人用人公信度,着力建设高素质干部队伍,7月18日,浙江省委出台了《中共浙江省委关于进一步深化干部人事制度改革的若干意见》。该文件是浙江
对于全球经济失衡的具体含义,中外相关研究中都没有给出明确的界定。从广义上来说,全球经济失衡可以指世界经济任何方面发展的不平衡,即经济发展不平衡、南北贫富的差距以及资本
随着因特网的日益普及,我国C2C电子商务也在蓬勃发展,C2C电子商务交易规模和用户规模呈现出不断扩大的趋势。虽然我国的C2C电子商务还处于成长期,许多C2C电子商务网站还没实现盈
一、选题意义  本论文对动态线性混合模型的参数估计进行了研究。线性混合模型是最重要的回归模型之一,通常用于纵向数据的分析,因为纵向数据分析的许多问题都可以纳入线性混
近年来 ,我国苹果总产量在逐年递增 ,但出口量却始终不及总产量的 2 % ,且售价仅为发达国家的 1 / 8,甚至更低。国内市场也是如此 ,果品价格一跌再跌 ,苹果生产增产不增收 ,
1927年中共八七会议后,党中央机关从武汉陆续搬到上海。中央机关在上海,有利的因素是:上海是全国最大的城市,地方大,好隐蔽,租界情况复杂,不登记户口,住房容易找,便于设立机
以藏茴香不同海拔高度的叶片为试材,采用改良过的过氧化氢-醋酸离析法对其进行上、下表皮切片制作,番红染色,中性树胶封片,并在奥特光学BK-5000(OPTEC-BK5000)显微镜下观察比