论文部分内容阅读
基于Gibbs抽样的贝叶斯模型选择结合先验信息,可以得到良好的估计与预测效果,从而受到各领域研究的重视。本文通过分析Gibbs抽样和Metropolis—Hastings算法构造转移核的本质,探讨了随机搜索变量选择(SSVS)方法和可逆跳马尔可夫链蒙特卡罗(RJMCMC)方法,以及这两种方法应用上的优势与不足。本文的模型选择着重于时间序列的自回归模型滞后项选择和向量自回归模型约束条件选择,分别推导出它们的条件后验分布,执行Gibbs抽样策略,得到后验模型概率,并用模拟数值例子和实际数据来说明SSVS方法和RJMCMC方法的效果。根据后验模型概率的大小,本文有效地对模拟数据和真实数据作出正确的模型选择。
贝叶斯方法可以很好地处理缺失数据。在应用SSVS方法于自回归模型滞后项选择时,本文将自回归模型的初始值作为随机变量加入到Gibbs抽样。这样可以充分利用已有的数据。
随机搜索变量选择方法对候选模型标号,并计算其后验模型概率。后验模型概率越高,对应的模型被选中的机会就越大,数据对该模型就越支持。它实质将模型选择问题转化成示性变量的选择问题,在Gibbs抽样过程中其模型的结构与变量维数是不发生变化的。而可逆跳马尔可夫链蒙特卡罗方法则将候选模型的结构和模型变量的维数看作是随机变量,并将其加入到Gibbs抽样迭代当中。这样,在每次Gibbs抽样迭代中,模型结构与变量维数可能是不同的。SSVS方法比较容易实现,而RJMCMC方法则比较符合模型选择的思想。
SSVS方法和RJMCMC方法的比较结果表明,在适当设置方法的超参数条件下,RJMCMC方法计算出来的最高后验模型概率一般高于SSVS方法,但这对最终模型的选择并不产生影响。无论模拟数值例子还是实际数据,两种方法选择的最终模型是相同的。同时,RJMCMC方法仅需要设置两个方法的超参数,即:模型系数的先验精度和可能的最大变量个数。而SSVS方法需要设置并确定很多方法的超参数。相比之下,RJMCMC方法减少了许多麻烦。值得注意的是,对于小样本量的情况,这里建议使用可以得到较大的最高后验模型概率的RJMCMC方法。
本文还应用SSVS方法随机搜索向量自回归模型的约束条件。结果显示,模型滞后阶数的大小会一定程度影响模型未知参数的估计精度以及后验模型概率的大小。滞后阶数越高,估计效果越不理想,并且计算的困难会更大。由于向量自回归模型未知参数可能很多从而候选模型数目可能很大,所以计算出来的最高后验模型概率一般不会超过5%。