基于辅助信息在分层抽样中敏感性问题的模型分析

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:ygeneral
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
敏感性问题是指所调查的问题涉及到私人机密的问题,例如:司机是否酒后驾车,学生是否考试作弊,纳税人是否逃税等问题。随机化回答技术(RRT)的出现使得敏感性问题的研究有了一种可方便操作和实施的调查方法,它在有效地保护了受访者私密的同时还提高了受访者真实回答问题的概率。分层抽样是抽样调查中常用的抽样方法。它实施起来简单易操作,若分层得当,可有效提高估计精度。本文首先介绍了研究敏感性问题的随机化回答模型。并结合分层抽样理论讨论了随机化回答模型在分层抽样中的应用,估计了Warner模型、Simmons模型以及改进模型在分层抽样下具有的敏感属性特征的比例π,给出了参数估计的表达式。  敏感性问题的研究往往涉及到私人机密,在被调查者对展开的调查不甚了解的情况下,调查得到真实有效信息的可能性通常比较小。因此在调查研究之前已有的历史资料和经验以及相关的有效辅助信息的存在就显得相当重要。辅助信息的引入和使用能有效的改进和完善抽样设计方案,提高估计的精度和节省抽样的费用等。因此,本文利用辅助信息引入辅助变量在随机化装置下对未知参数分别进行比估计和回归估计。讨论和比较在有辅助信息可利用时,比估计和回归估计模型与原Warner模型和Simmons模型在简单抽样下的估计量和方差。通过对比估计和回归估计的随机化模型的分析和效率比较发现:加入辅助变量后,在满足一定的条件下可以提高估计量的精度。再则还可以利用已有的辅助信息,得出先验信息及先验分布,运用贝叶斯统计推断对参数进行估计。本文讨论了贝叶斯方法在敏感性问题的应用。利用先验信息获得先验分布,使用贝叶斯估计求出后验分布,从而计算出估计量,也达到了有效利用已知的辅助信息的目的。
其他文献
混合模型是一种基于模型的无监督聚类方法,常用的混合高斯模型已有大量研究。本文研究的混合厄朗模型(Mixed Erlang Model,称为MER)形式简单、灵活多变,其主要目的是为了解决混合模型非负随机变量问题。本文针对混合厄朗模型提出一种新的参数估计方法,称为CMM-EPML算法。该算法主要分为两部分,第一部分混合厄朗模型形状参数初始化算法:CMM算法,即利用K-Means算法对样本进行聚类,然
学位
符号模式矩阵主要研究其定性类中实矩阵的仅与其元素的符号结构有关而与其元素数值大小无关的组合性质,是由经济学家P.A.Samuelson为解决当时国际经济出现的问题而提出的经济