论文部分内容阅读
删失数据是生存分析、生物学、可靠性工程学、医学以及经济学等领域中普遍存在的一种数据,包括左删失、右删失、区间删失等具体类型,其中左删失和右删失数据在某种意义下都可看作特殊的区间删失数据。对于右删失数据,目前已经有了很多深入的研究结果,比如:Cox and Oakes(1984)[1],Kalbfleisch andPrentice(2002)[2]等专著对右删失数据的处理方法进行了系统的介绍。但对于一般的Ⅱ型区间删失数据,其处理方法相对于右删失更加具有挑战性,并且绝大多数用于右删失数据的估计方法对区间删失并不适用,这就需要针对区间删失数据的特点来研究一些新的方法。于是,本文主要的研究结果是,将基于部分区间删失数据的自相容算法和插补方法做比较研究以及仿真模拟,得出结论。 关于区间删失数据的生存函数,目前已有一些较好的估计方法(Sun,2006),如Turnbull的算法、修正EM算法、自相容算法等,其中自相容理论在非参数估计中应用较多。本文针对既包含右删失数据又包含一般Ⅱ型区间删失的部分区间删失数据,在前人研究的基础上,对自相容算法进行介绍,并说明这种估计本质上得到的是非参数最大似然估计。但是,由于自相容算法的迭代过程较复杂,程序编写麻烦、运算量较大,本文受Sun等人(2015)[4]中提到的方法的启发,探究了除自相容估计之外的另一种更为简便的方法:用插补方法取区间删失数据的中点为近似的死亡时间,将部分区间删失数据插补成右删失数据,然后用乘积限估计式(KM估计式)进行估计。最后本文将这种方法的结果与自相容算法的结果相比较,得出此种方法的优劣和适用范围。 本文结构如下:第一章为绪论,首先介绍了区间删失数据的研究背景和研究现状,然后对区间删失数据做出了定义和分类;第二章先简要介绍了区间删失数据的生存函数估计的最常用方法……自相容算法的研究背景和具体步骤,其次介绍了将数据用插补方法近似成右删失数据,再用Kaplan-Meier估计式来估计生存函数的方法;在第三章中,分别用自相容算法和插补方法对指数分布和威布尔分布中的数据模拟研究,将插补方法得到的结果和自相容算法相比较;第四章对早期乳腺癌患者整形手术恶化时间的实际数据进行实证分析;在第五章对全文进行了总结与展望。