论文部分内容阅读
空间离群点检测就是为了从空间异常对象、异常模式中挖掘出潜在的有用信息。空间离群点检测是空间数据挖掘技术的一个重要分支,在交通、生态、气象、公共健康、公共安全等领域有着广阔的应用前景。在当今信息化的时代,各行各业数据积累速度呈指数级快速增长,特别是空间数据呈现出属性多,数据量大的特点。鉴于现有的一些空间离群点检测算法对多属性的空间数据处理效果不佳,本文从提高多属性空间离群点的检测精度和计算速度出发,对基于多属性的空间离群点检测算法进行了深入研究。本文主要研究内容包括:建立了一种基于多属性的空间离群点检测模型MASODM,主要分为数据准备、属性划分、冗余剪枝和离群检测四个步骤;针对空间数据多属性的特点,提出了一种基于属性稀疏度的冗余属性剪枝算法ASD,减小无关属性对离群检测结果的影响;考虑到空间数据的自相关性和异质性的特点,结合ASD冗余属性剪枝算法,提出了一种高效的基于马氏距离的多属性空间离群点检测算法MASOD,使得检测结果更加精确;在MASOD算法的基础了提出了一种改进的基于多属性的空间离群点算法FASTMASOD,通过事先有效排除不可能是离群点的空间对象,从而大大提高空间离群点检测的计算速度;最后通过实验验证了算法的正确性和高效性。