论文部分内容阅读
广义部分线性模型结合了广义线性模型和部分线性模型的优点,是一种具有广泛实用价值的半参数回归模型.数据缺失问题在现实中比较普遍,抽样调查、临床试验和纵向数据等研究中都会遇到数据缺失.对缺失数据建立统计模型,基于完全数据的参数估计、变量选择和假设检验方法将不再适用.因此,在缺失数据下重新探讨统计模型的参数估计与变量选择问题就具有重要意义. 本文所研究的是带有非随机缺失数据的广义部分线性模型的估计问题.非随机缺失也称缺失机制是不可忽略的.对于带有缺失数据的模型,通常的做法是利用EM算法的思想近似模型的观测似然函数来进行统计推断.EM算法分成了两种做法,一种为Bayes方法,以完全Bayes估计、多重赋值为代表;另一种是频率方法,以分数填补为代表.本文借鉴了参数分数填补的思想,对EM算法E步进行了改进,利用填补的分数权重,得到了观测似然函数的加权近似式.EM算法在每次的迭代中均需要从条件分布生成填补值,改进后的模型仅需要在每步迭代更新分数权重,大大提高了计算效率.借鉴拟似然方法得到广义部分线性模型观测似然函数的表达式,并研究了估计量的渐近性质.最后,通过模拟验证所给方法具有较好的渐近性质和拟合效果.