论文部分内容阅读
数据是科学研究的基础。在资源环境领域,由于研究对象往往在地理空间上连续分布,对研究对象的调查或者监测很难获得关于研究总体的全部数据。即使有时,人们花费大量的人力、物力调查得到研究对象在空间中的所有对象,也只是研究对象在某一时刻的值。因为,自然环境中的研究对象,往往还具有时间属性,在时间维度上存在变化。这一点与传统的抽样不同。因此研究者常常通过研究对象中的“样点”对研究对象总体进行推断。传统抽样调查方法处理的对象是离散的,并且样本之间互换不会影响调查结果。资源环境领域中的空间抽样的一个显著特点是样本具有空间属性即具有经纬度坐标。样本如果交换,则会影响抽样调查结果。
近年来,随着数据获取的能力提高,人们的关心从数据的可获得性转移到数据的代表性。根据调查数据得到的结论,能够在多大程度上反映真实总体。这也就是本文研究的样点的代表性问题。通过本文的研究,能够回答以下几个问题:如何衡量样本的空间代表性;如何将样本的空间代表性引入到对总体的估计中;样本代表性在属性空间中如何衡量和表达;如何利用样点代表性对已有监测网络进行评价。
具体而言,本文首先将引入空间方差概念,通过空间方差能够对总体参数进行更准确的估计。空间方差的计算由二个部分组成:多边形内任意两点之间距离的概率分布和半变异方差。本文提出了基于蒙特卡洛方法的距离的概率分布计算公式,并且给出了长方形和正方形计算概率分布的表达式。通过模拟数据的比较研究,证明空间方差在计算具有空间相关性的抽样总体时,能够提高抽样精度。
然后,本文将介绍在调查之前,如何确定单个样本的大小即样本在地理空间上的范围或面积。本文将论述样本面积大小、抽样率与抽样结果误差之间的关系。本文首先生成具有不同空间相关性和空间抽样分辨率的抽样总体,然后采用不同的抽样率进行抽样,最后对总体进行统计推断并对结果进行比较分析。
本文最后选择了二个案例详细说明如何评价已有样点的代表性。中国气象台站案例中,主要说明了在能够通过相关变量得到调查目标变量的回归方程时,如何评价样点的代表性。在中国生物媒介监测网络案例中,说明了在不能利用相关变量回归目标变量时,只有目标变量与相关变量的定性知识,如何利用定性知识分析样点的代表性,以及通过定性知识的定量化方法,评价样点的代表性。