论文部分内容阅读
随机效应模型在经济学、心理学、生物学和工程学等领域研究中,常用来分析来自于同一个个体在不同时间、空间等条件下的重复测量数据,因而它是研究重复测量数据的一个有力的工具,由于随机效应模型既考虑了个体之间的共性又考虑了个体之间的差异,所以有着广阔的应用前景,其研究倍受理论工作者和应用工作者的青睐。
一般的随机效应模型只是考虑了把随机效应当成缺失数据,并未考虑到观测数据有缺失的情况,而在社会学、经济学、教育心理学、生物遗传学和金融保险学等研究领域中存在着大量的缺失数据。例如居民收入调查研究中,由于被调查的疏忽或粗心忘记了回答问卷中的部分问题而导致的数据缺失;在毒品和艾滋病调查中由于被调查担心自己的隐私被暴露而不愿意回答问卷中的部分问题导致部分数据缺失;在药物药效研究中药物本身的副作用致使一些病人放弃该药物的治疗而导致数据缺失,所以对缺失数据的研究尤其是对不可忽略的缺失数据研究具有非常重要的理论意义和实际应用价值。
对于一个既定的统计模型,通常都需要有一组假设条件,只有当观测数据满足假设条件时,有关的统计推断才是合理的。局部影响分析就是要设法判别实际数据是否与模型存在较大偏离,并检测出那些严重偏离既定模型的数据点以及对统计推断结果影响特别大的点,即异常点或强影响点。本文进行局部影响分析主要是如何检测异常点或强影响点,而不如何具体处置异常点或强影响点。
Zhu H T和Lee S Y.(2003)研究了广义线性随机效应模型的局部影响分析;宗序平,赵俊,王海滨,韦博成(2003)研究了指数族非线性随机效应模型的局部影响分析。然而,关于不可忽略缺失数据时广义非线性随机效应模型的局部影响分析,目前尚未涉及。
本文对不可忽略缺失数据的广义非线性随机效应模型的局部影响分析进行了研究,做了如下工作:运用EM算法和MH算法对缺失数据进行抽样并求出参数的估计值并通过几种不同扰动模型,进行局部影响分析,检测出对模型有较大影响的异常点或强影响点。
本文创新点如下:
1.考虑了不可忽略缺失数据下的广义非线性随机效应模型,可以给统计推断带来更多的信息,提高统计推断的精度。
2.考虑了上述模型的局部影响分析,通过引入扰动概念,检测出数据集中对模型有较大影响的异常点或强影响点。