论文部分内容阅读
在预测模型中,当自变量的维度增加时,预测精度和算法性能都会显著下降,这就是所谓“维度诅咒”的问题。针对这一问题的多数解决方法都依赖所谓稀疏性假设,即函数值只依赖高维变量中的少数维度。高维非参数回归方法利用稀疏性假设有效克服“维度的诅咒”,同时具备非参数回归方法适应性强、预测精度高的优势,已成为统计机器学习领域最重要的研究方向之一。
本文的核心内容是:
首先,对高维非参数回归领域目前最有效的方法之一——导数期望正则化方法(RODEO)进行了深入研究,经理论和实证分析,发现原始RODEO算法在变量选择和预测精度等方面存在若干缺陷。在此基础上我们从函数估计方法和全局性两方面对算法进行改进,改进的算法有效克服了原有问题,在现实应用中具有更好的适应性,并且实证研究表明预测精确度更高。
其次,本文将改进的RODEO算法应用经济建模中,用于解决大因素集下宏观经济变量的预测问题。在Stock-Waston标准宏观经济数据集上进行测试,并将结果与主成分回归、基于高斯先验分布的贝叶斯回归、基于双指数先验分布的贝叶斯回归等三种现有的最优方法进行比较。结果发现,改进的RODEO算法预测精度远高于现有的最优结果。
本文的创新点在于:
算法研究方面,对高维非参数回归领域目前最优的方法之一——导数期望正则化方法(RODEO)进行改进,克服原始算法存在的若干缺陷,得到统计精度更高,更具适应性的算法。
算法应用方面,首次将高维非参数回归方法引入计量经济学研究领域,为大因素集下宏观经济指标预测问题提供了系统、高效的解决思路,可以由数据出发进行因素自动选择、模型自动构建,并且预测精度高于现有最优的结果。