社会调查中缺失数据处理方法的比较分析——以北京市流动儿童心理状况研究为例

来源 :北京大学 | 被引量 : 0次 | 上传用户:zydwnj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着抽样调查和问卷调查的方法被广泛运用,调查中的缺失数据受到社会科学家越来越多的关注.目前,国内社会科学领域对调查中的缺失数据一般采用列删法进行处理,该方法过于简单,并且有可能导致错误的结论.基于这样的背景,本文提出了缺失数据处理中几个基本的问题:1)对缺失数据采用列删法进行处理是否会造成结果的偏差;2)不同的缺失数据插补方法究竟孰优孰劣;3)基于重要的辅助变量对样本进行分类,并在各个分类单元内使用数据插补方法得到的结果是否更好。本文通过北京市流动儿童发展跟踪调查(PSDMC)第三期的数据,对存在缺失值的父亲受教育水平、家庭月收入、亲子交流状况三个变量分别使用列删法、均值插补法、条件均值法、热平台插补法以及链式方程多重插补法进行处理,并对处理之后数据集的分布以及回归分析的结论进行比较.主要的研究结论包括以下几个方面:1)当数据缺失率较高,特别是在数据本身异质性较大的情况下,使用列删法存在较大的问题,在复杂的统计分析中,会造成分析结果明显的估计偏误;2)多重插补方法较其他的插补方法而言,得到的插补数据能够更好的“还原”原始数据的分布;3)基于分类的数据插补方法,由于使用了与需要插补变量相关的辅助信息,优于非分类的数据插补方法.
其他文献
改革开放三十多年来,单位组织与单位体制都发生了深刻的变化。对M学院工作环境与权力关系的研究表明,在单位组织与国家的关系、个人与单位组织的关系、个人与单位组织领导的关
改革开放以来,我国民办高等教育获得了快速、健康的发展,为形成高等教育多元化发展格局,加快高等教育大众化进程做出了贡献。20世纪90年代以来,有关民办高等教育理论研究的文献日
本研究将代际经济分为净流量和流动方向两个角度来分析家庭类型因素、子女数、隔代照料、年龄队列的对于代际经济流动的影响。代际经济流动作为家庭功能的体现,无论代表抚养的
为了解北京市朝阳区学生营养餐送餐企业生产加工卫生状况及营养午餐的实际营养素供给情况,2010年9~10月对辖区内全部29家学生营养餐送餐企业生产加工卫生状况和从业人员的食
2010年全国第六次人口普查显示我国流动人口数量已达到2.6亿。我国人口流动规模之大、影响之广泛,是我国城市化进程中不可忽视的现象。流动人口为促进我国经济发展提供了充足
学位
本文以对深圳市南山区塘村的实地调查为基础,试图从对居民工作站中综合协管员的全面调查入手,通过描述并分析协管员的日常工作实践,力求揭示出协管员作为政府在城中村的权力末梢
财经报道一直倡导严肃、严谨、理性、专业、冷静。专业、理性有益于报道,也形成了财经报道独特的个性,但很长一段时间,财经媒体也受到一些读者的冷遇和抱怨,因为在他们眼中,
扬州清华紫光化学有限公司成功开发出常温均相节流法合成三氯异氰尿酸及二氯异氰尿酸(盐)新工艺.rn新工艺采用液氯直接进料,免去液氯气化工序,利用液氯气化吸收氯化反应放出
本文分析并且比较3起具有典型意义的合(或拉)隔离刀闸时发生的电气事故.rn1接地保护线竟然成了烧人线rn1.1事故经过:rn1994年4月6日下午3时许,某厂671变电站.运行值班员接班