论文部分内容阅读
由于人们的科学意识不断进步,分析研究的科学精神逐渐深入人心,现代生活中常常需要面对数据的收集与处理,以便更高效地完成日常工作。在所有可能出现的数据中,成分数据是一种满足特殊性质的复杂多维数据,一般用于研究一个整体中各部分间关于指定因素下的比例关系。随着经济发展水平不断提高,各行各业越来越意识到精确数据统计带来的好处,成分数据因此也应用得越来越广泛。然而实际问题中,我们发现收集统计的数据常常会存在缺失,例如问卷中的无效或空白信息,收集中的遗漏等等都会产生缺失数据。统计质量会受到缺失数据的影响,导致估计偏差,产生不良结果。故而我们希望数据能够完整,因此对缺失数据的补全显得尤为重要。目前国内外在缺失数据的处理方面已有不少成果,本文在前人的研究基础上,尝试利用核函数的方法进行缺失值填补,研究对比不同方法的优劣。本文分为五章:第一章说明了本文的研究意义,阐述了当前的研究背景,国内外的研究现状,并对一些基本情况作了概述。第二章简要叙述了成分数据的基本概念,以及需要用到相关的相关知识,对研究过程中的大致操作进行描述,并对已有的一些方法给予介绍。第三章是本文重点,提出了基于核函数的几种成分数据缺失值填补法,阐明了提出方法的原因、过程以及具体实现步骤。第四章通过对提出的几种基于核函数的缺失值填补方法与已有常见方法的模拟实验对比,得出实验结果,并对真实数据进行实例分析,以验证方法的可行性。最后一章进行了总结,提炼本文的研究结论,以及对今后研究的展望。