基于分位数回归技术的删失数据的多重插补

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:yjsngmmsnjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多现实的问题中,由于存在主客观条件的约束,得到的观测数据往往都不是精准的数据,有时只知道感兴趣的数据集中的一些数据的值是小于(大于)等于某个数值或者是介于某个区间段内,这种不完整数据被称之为删失数据(Censored Observation)。存在不同种类的删失数据,比如左删失、右删失和区间删失,另外删失又可以分为固定删失和随机删失。在20世纪70年代末期,对于上面描述的不完整数据的情形,Dempster,Laird和Rubin(1977)提出了一种可以有效估计的EM算法。基于这个算法,Rubin(1977)则提出了通过模拟的思想实现了针对不完整数据的多重插补。此后,Rubin发表了这方面的一系列文章,尔后将其整理并于1987年出版成册,系统地归纳了多重插补法的思想及理论框架。另外分位数回归模型提供了一个半参数化的方法,它可以灵活地处理解释变量与被解释变量之间的关系。即使所研究的数据具有异质性,也能对其进行建模。到目前为止,将分位数回归方法与不完整数据相结合的研究不多,然而分位数回归对处理具有删失的响应变量的情形可以说是非常适合的。因为对误差项没有严格的参数假设,条件均值函数可以是不可识别的。在这篇论文中,着重提出了在响应变量服从固定删失的情形下将分位数回归与多重插补相结合去插补那些被删失数据的一个新方法。将最终得到的结果与其他方法的结果作了一些适当的比较,发现运用此种方法得到的结果基本符合预期。这篇论文的目的主要是提出一个新方法将删失了的数据包括进来并对其进行修补,从而提高估计的效率。本文的主要结构如下:第一章绪论,这里主要介绍了本文的研究背景、研究意义以及文献综述,并告知文章的行文脉络,即研究的思路与框架,另外就是本文研究的主要创新之处。第二章首先介绍了分位数与分位数回归的基本概念、参数估计方法。然后介绍了删失分位数回归的理论及性质。最后着重阐述了多重插补法的一些理论基础。第三章主要针对响应变量存在删失的数据进行插补而引进了一个新方法——基于分位数回归技术的多重插补法,先介绍与它相关的基本理论,再运用这个方法对多种固定删失数据情形进行模拟,并对模拟后的结果进行详细分析。在第四章里面,将提出的方法运用于实际数据下的例子并对结果进行适当的分析。第五章对所提出的方法进行总结,并提出了本文的不足与展望。
其他文献
改革开放三十多年以来,中国经济实现了跨越式增长,取得了举世瞩目的成就。但伴随经济步入新常态的是收入差距的全方位扩大。收入分配格局的总体失衡已经成为我国全面深化改革
当前,电信业的竞争变得越来越激烈,而且随着智能手机和互联网应用的普及,一些网络聊天工具像微信、QQ这类通讯软件对电信业的传统业务如短信业务和语音业务带来了一定的影响,因此,进行客户细分,识别有价值的潜在客户变得尤为重要。本文拓宽了以单一指标如客户价值来进行客户细分的指标体系,结合互联网的深入应用给企业和客户带来的变化,最终确立了一套贴合实际的指标体系。在确立客户细分指标体系时,本文将数据挖掘的思想
根据麻/棉及麻/粘纱的特点合理地制定前处理工艺,保证了强力及染色要求,同时就CL型染料的选择及合理的工艺范围进行了讨论.