论文部分内容阅读
半参数广义线性混合效应模型(GPLMM)是广义线性随机效应模型和非参数回归模型的自然推广,近年来,在生物医学、公共卫生、经济、教育等众多领域的数据分析中有广泛的应用.半参数广义线性混合效应模型是研究重复测量数据和纵向数据的一个有力工具.半参数广义线性混合效应模型,既含有固定效应,又含有随机效应;既含有参数部分,又含有非参数部分;综合了参数模型和非参数模型以及混合效应模型的许多优点,更能充分利用数据中提供的信息.因而它可以概括和描述众多实际问题,是一类具有普遍性和代表性的模型,已越来越受到人们的广泛重视. 本论文针对半参数广义线性混合效应模型,研究了它的Bayes估计、Bayes局部影响分析以及Bayes数据删除影响分析等一系列问题.现将主要研究内容概述如下: 1.在研究半参数广义线性混合效应模型的所有文献中,都假定随机效应服从某一特定的参数分布族(如正态分布).但在实际应用中,随机效应不一定都服从某一特定的参数分布族而是服从一类非参数分布族,如可能包含偏态、双峰、厚尾分布等等.并且,当在所考虑的模型中随机效应不服从指定的参数分布假设时,可能对随机效应和参数的统计推断产生很大的影响.因此,在本文中我们考虑用一类灵活的分布族-Dirichlet过程先验分布来对随机效应部分进行建模.用惩罚样条来近似模型的非参数部分.我们使用结合Gibbs抽样和Metropolis-Hastings算法的混合算法从后验分布中进行抽样,从而得到模型的未知参数、随机效应及其非参数部分的联合Bayes估计;在此基础上,定义了三种评价模型拟合优度统计量:后验预测p值,基于SREε(p0)的后验概率和偏后验预测p值;通过构造路径抽样计算Bayes因子,并基于Bayes因子进行了模型选择. 2.本文在Zhu et al.(2011)的基础上,针对GPLMMs建立起一套Bayes局部影响分析方法来评价模型对于对个体数据、先验分布、样本分布同时微小扰动的敏感性.针对于此模型,我们构造了Bayes扰动流形以及选择了一个适当的扰动模式,并在扰动流形上构造了切空间及计算出了相关的度量张量;我们还发展了基于目标函数(如φ差异统计量,后验均值距离统计量,Bayes因子)的Bayes局部影响测度.在计算过程中,本文采用MCMC算法从后验分布中产生随机观测样本,并基于随机观测样本来计算Bayes局部影响测度. 3.本文在Zhu et al.(2012)的基础上,针对GPLMMs建立起一套基于Bayes数据删除影响诊断方法来评价模型对于删除一个数据点或数据组的敏感性.我们用另一光滑样条P-样条对半参数广义线性混合效应模型(GPLMM)的非参数部分进行建模,采用Gibbs抽样与M-H算法相结合的混合算法得到模型的未知参数、随机效应和未知光滑函数的联合Bayes估计;在此基础上,计算了三种Bayes数据删除影响测度(φ-差异统计量、Cook后验均值距离统计量、Cook后验众数距离统计量);还用Fisher得分迭代算法得到参数的极大似然估计;分别给出了基于点和组删除模型的参数估计的一阶近似计算公式;并用这些一阶近似计算公式来计算Cook后验众数距离统计量,这大大提高了算法的效率和收敛性.