论文部分内容阅读
随着GIS技术在滑坡灾害空间预测研究中的广泛应用,滑坡灾害空间预测方法成为研究的热点问题。滑坡灾害的空间预测可看作一个基于两类样本的分类问题。近年来一些较新的统计和机器学习方法,如:二值逻辑回归、广义加法模型、支持向量机、分类与回归树等被广泛应用与生态学、医学、以及遥感和地理信息系统等领域来解决这一分类问题,并被广泛证明能够取得良好的效果。本研究中,分别采用了这四种方法,在深圳市的一个研究区域内进行滑坡灾害的空间预测。
考虑到地形、地貌、地质条件、以及植被覆盖和人类工程活动的影响,我们选取了坡度、坡向、高程、平面曲率、剖面曲率、NDVI、地层岩性、建筑物密度,以及到河流的距离、到断层的距离共十个参数作为影响该地区滑坡灾害危险性的影响因子参与各种模型的构建。
在模型训练的过程中利用样本数据进行10折交叉检验,并在每次检验过程中计算各种模型对应的ROC曲线下方的面积(AUC)值作为评价模型效果的标准。交叉检验所得的四种方法的平均AUC值以及针对四种方法所得四组AUC值进行的成对假设检验结果表明:在研究区条件下,广义加法模型和支持向量机的预测效果相当,且好于二值逻辑回归和分类与回归树。在四种模型训练完成之后,分别应用于整个研究区域绘制出滑坡灾害危险性分布图。在确定危险区域与稳定区域的分类界限时,综合考虑了模型对于检验样本中发生事件和未发生事件预测结果的正确率,通过计算为每种模型选择了最佳的分类阈值。划分危险区域和稳定区域之后,考虑到各种方法所得空间预测图上危险区域的面积,以及正确预测的历史滑坡比例,支持向量机所得的预测图具有更高的效率。
文章还讨论和试验了在二值逻辑回归中使用回归系数显著性检验和逐步回归以及基于回归树进行因子重要性分析的方法。并设计和实现了基于二值逻辑回归和交叉检验的新的定量化的因子重要性分析方法。通过方法试验,发现在研究区域内坡度、坡向、高程、NDVI这四种因子对于滑坡灾害的发生具有较为重要的作用。最后,利用这四种重要因子构建了广义加法模型,绘制出各个因子与滑坡灾害危险性之间的关系曲线,并简要的分析了曲线反应的地理和地质含义。