论文部分内容阅读
数据分析、建模及推断是统计发展中的重要内容,在数据分析中体现了统计的思想、方法和模型及其广泛应用背景。不完全数据经常出现在许多研究领域中,如临床试验、经济与金融和社会学等等的研究中。数据分析及建模,特别是不完全数据的研究,对随机事件做出指导及决策起到了很重要的作用。如何衡量或减小数据带来的风险或者分析过程中建模产生的风险一直是统计学者们感兴趣的热门话题。本文提出了在生存分析中的复杂数据下的风险模型以及随机模拟中输入风险的研究方法,也解决了一些实际问题。 这里我们感兴趣的不完全的生存数据结构是两类:右删失长度偏差数据和随机缺失的协变量数据。我们先对这两类数据结构分别进行研究,最后再研究同时具有这两种结构的数据集。在第二章中,我们在更弱的条件下给出了针对右删失长度偏差数据的组合乘极限估计,推导出它的强表示,同时给出了该估计的收敛速度。第三章里,我们将估计方程投影法运用到带随机缺失协变量的加性风险模型中,得到了参数的相合估计。在这两章中,我们都从理论上证明了估计的相合性和渐近正态性,且在模拟中验证了我们提出的估计优于其他估计的结论。然而,我们真正感兴趣的是带随机缺失协变量的右删失长度偏差失效时间的加性风险模型分析。因此,基于前两章对于这两种数据结构分别的分析结论,我们在第四章提出了一个新的估计方程来解决这个问题,并从理论和模拟两方面验证了由本文提出的方法得到的估计具有相合性和渐近正态性。 然而,现实生活中很难知道真实风险模型,错误的模型假定可能导致极大的估计误差。因此我们提出近十几年来热门的统计方法——模型平均法,来避免上述情况的发生。为了更好地理解这个热门的统计方法,我们将在五章中把该方法应用到随机模拟中减小输入风险的问题研究中。随机模拟由输入和逻辑组成。当我们所用的输入模型是从真实的历史数据中“拟合”而来的,那么模拟模型的风险中有一部分就是由输入风险,或者说输入不确定性导致的。虽然目前已经有许多量化或者对冲输入风险的方法了,但是还没有一种方法尝试直接降低这种不确定性。文中这部分的一个重要贡献是用J-折交叉验证模型平均法,通过更好的估计未知的输入真实分布来降低输入模型风险。输入模型平均基于输入模型的标准应用方式,不需要改变任何模拟方法或者后续实验。我们将从理论和经验模拟两个角度来阐述我们的方法,并验证这个方法在降低输入风险的有效性。