高维数据的非参数回归算法及在经济建模中的应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:gonyen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在预测模型中,当自变量的维度增加时,预测精度和算法性能都会显著下降,这就是所谓“维度诅咒”的问题。针对这一问题的多数解决方法都依赖所谓稀疏性假设,即函数值只依赖高维变量中的少数维度。高维非参数回归方法利用稀疏性假设有效克服“维度的诅咒”,同时具备非参数回归方法适应性强、预测精度高的优势,已成为统计机器学习领域最重要的研究方向之一。   本文的核心内容是:   首先,对高维非参数回归领域目前最有效的方法之一——导数期望正则化方法(RODEO)进行了深入研究,经理论和实证分析,发现原始RODEO算法在变量选择和预测精度等方面存在若干缺陷。在此基础上我们从函数估计方法和全局性两方面对算法进行改进,改进的算法有效克服了原有问题,在现实应用中具有更好的适应性,并且实证研究表明预测精确度更高。   其次,本文将改进的RODEO算法应用经济建模中,用于解决大因素集下宏观经济变量的预测问题。在Stock-Waston标准宏观经济数据集上进行测试,并将结果与主成分回归、基于高斯先验分布的贝叶斯回归、基于双指数先验分布的贝叶斯回归等三种现有的最优方法进行比较。结果发现,改进的RODEO算法预测精度远高于现有的最优结果。   本文的创新点在于:   算法研究方面,对高维非参数回归领域目前最优的方法之一——导数期望正则化方法(RODEO)进行改进,克服原始算法存在的若干缺陷,得到统计精度更高,更具适应性的算法。   算法应用方面,首次将高维非参数回归方法引入计量经济学研究领域,为大因素集下宏观经济指标预测问题提供了系统、高效的解决思路,可以由数据出发进行因素自动选择、模型自动构建,并且预测精度高于现有最优的结果。
其他文献
综合媒体并不是一种具体的媒体形式,而是文本、动画、音频、视频、交互性信息的综合表达,是由多种媒体信息有机构成的动态可交互集合,支持按照指定的时间、空间布局同步呈现各种
车辆识别是智能交通管理系统的重要组成部分,同时也是数字图像处理技术、模式识别技术和计算机视觉等交叉学科研究的热门课题。目前,车辆识别系统主要是针对车牌进行识别,但
随着人工智能、大数据和物联网等新兴技术的迅猛发展和交叉融合,数据中心和超算中心的应用负载特征呈现愈发明显的多样化趋势,对互连网络的灵活性要求越来越高。现有的软件定义
在我国,近些年城镇车辆保有量迅速增加,汽车日益成为人们生活的一个重要组成部分。为了满足人们日益增长的通过网络获取信息的需求,车辆网络(简称VANET)应运而生。VANET网络为安
“面向863孵化器的综合技术服务平台”(简称:孵化器技术服务平台)是面向全国各863孵化器、软件技术服务机构和软件企业的综合技术服务平台。该平台采用开放的SOA技术架构,服务
中国教育与科研计算机网(CERNET)跨机构统一认证和资源共享基础设施(CARSI)项目旨在以跨机构联盟的形式搭建跨域应用资源和用户真实身份信息共享平台。跨域统一认证和资源共
随着半导体行业的飞速发展,集成电路规模的不断提高,系统芯片SoC(System on Chip)技术已逐渐成为集成电路技术的主流。由于信息产业的迅猛发展,信息化已经深入到国计民生的各个
某供电局电力信息一体化平台整体结构复杂、信息量大,综合了设备台帐、电力生产、电力设备采购、电力管理办公、变电运行日志、无功管理、停电计划管理、电力培训等多个系统,但
随着语义网的发展,本体越来越多地在各个领域被应用。然而由于本体的创建对领域知识的理解不同,侧重的角度不同,使用的建模方法不同,即使是在同一领域的共享概念上创建的本体,不同
当前,信息系统已经从纯粹的信息展示窗口演变成包含实际应用逻辑的业务平台。这要求信息系统不仅能够支持数据的展现、存储、检索和管理,还应该支持对业务流程的管理。然而,在大