论文部分内容阅读
本文主要讨论用贝叶斯随机搜索方法进行模型选择及参数估计。借助拉丁变量计算的贝叶斯随机搜索模型,把模型选择问题转化为对拉丁变量后验分布的分析。在通过积分等手段,使得其他感兴趣的参数不出现在拉丁变量的后验分布后,利用马尔科夫链蒙特卡罗(MCMC)方法,特别是混合的Gibbs-MH抽样算法实现从模型空间(拉丁变量的后验分布)和参数空间的联合抽样。
对MCMC方法进行简单的介绍后,着重讨论贝叶斯随机搜索方法的建模过程,及各个模型MCMC算法的选择。首先结合耗氧量数据集讨论了随机搜索变量选择(SSVS)模型的建立及其计算过程。接着介绍贝叶斯非参数回归(NR)模型和贝叶斯非参数似不相关回归(NSUR)模型,并用效率更高的焦点抽样算法从拉丁变量的后验分布抽样。两个模型在相关数据集下的计算结果和不相关数据集下的计算结果表明本文的NR和NSUR模型均能准确地估计函数,此外,NSUR模型估计的相关系数也是准确的。进而用NR模型和NSUR模型来探讨北京、天津、上海三地农村居民现金收入与生活消费现金支出间的关系,及三地间的相关程度,只有北京和上海呈现明显的相关性。然后讨论了贝叶斯多变点模型,连续用三个MH算法对拉丁变量后验分布抽样。对英国司机死亡或者重伤的月度数据集分析,在MAP算法模式下找到了三个变点。
基于贝叶斯随机搜索方法的思想,我们提出一种有效解决门限自回归(TAR)模型的贝叶斯方法,在不假设固定的机制个数条件下,借助拉丁变量建立贝叶斯随机搜索TAR模型。在此模型下,拉丁变量的后验分布包含了机制的个数和门限参数的信息,因此滞后阶数、门限值和所有回归系数等的估计均通过MCMC方法从他们的后验分布抽样。用此方法分析从模型AR(1)、TAR(2,1,1)、TAR(3,1,1,1)中产生的样本,模拟结果表明此方法能很好地的估计机制数、延迟参数、门限值及各机制下的回归系数。用贝叶斯随机搜索TAR模型对太阳黑子年度数据集进行分析,找到三个门限值,即10.2,40和73,该例子与已有文献中用其他方法得到的结果一致。