论文部分内容阅读
入湖河流是衔接湖泊流域陆域复合生态系统和湖泊水生生态系统的纽带,改善湖泊水质和恢复湖泊水生态系统的根本手段是控制由入湖河流传输到湖泊的污染负荷量,其中入湖河流污染负荷估算就是一个重要问题。为解决入湖河流污染负荷估算中的数据缺失问题,本文首先提出了流域模拟模型的基本表达式及其在流域模拟、估值、预测、决策中的作用,然后探讨了缺失数据模式、缺失数据机制及缺失数据分析方法,以确定适用于流域模拟模型缺失数据分析的工具,通过比较选择了缺失数据多重插补方法中的EMB算法。接着,论文分三步进行研究:第一步构建数据缺失下滇池流域降雨模拟GLM模型,包括:(1)采用方差膨胀因子大于5作为多重共线性的判断标准,对协变量进行初步筛选;(2)采用EMB算法对数据中的缺失值进行多重插补,进而分别采用Logistic回归和对数正态线性回归的方法进行降雨事件预报与降雨量估计;(3)为了模拟精度,分别采用SVM、CART和NN算法来与之对比,发现GLM是其中模型结构最简单而效果略低于SVM的一种方法;(4)在降雨量估计上,通过EMB算法能够得到比GLM回归更可靠的降雨量期望值与置信区间。第二步选用以CMD为非线性损失模块和以EXPUH为线性演算模块的IHACRES来进行数据缺失下滇池流域入湖河流水文模拟,包括:(1)利用雨量站点位来构造泰森多边形通过面积加权来确定各个子流域的平均雨量;(2)以Nash-Sutcliffe效率系数为目标函数,将2001年作为模型预热期,2002年至2010年作为模型参数率定期,分别对完全数据和EMB插值数据进行参数率定;(3)以Nash-Sutcliffe效率系数大于0.25且相对偏差在50%以内作为入湖河流能被IHACRES模型识别的阂值,对完全数据和插补数据率定结果进行比较,选出了包括海河和盘龙江在内的17条可以被识别的河流;(4)根据可识别河流逐日模拟流量和不可识别河流逐月插值流量,分别计算了月、年时间尺度和流域、河流空间尺度下的总径流值与置信区间。第三步建立数据缺失下滇池污染负荷估算的LOADEST模型,包括:(1)确立可识别河流日流量和十进制时间分别与TN、TP瞬时污染负荷之间的回归关系;(2)计算对数变换下的污染负荷的最小方差无偏估计量及相应的置信区间与预测区间,并反算各条河流TN、TP瞬时浓度及置信区间;(3)提出一种针对对数正态回归区间估计的升尺度方法及不可识别河流区间估计的简单方法;(4)实现滇池入湖河流TN、TP月总入湖污染负荷、年总入湖污染负荷、各入湖河流污染负荷年均值及其置信区间的估算。