论文部分内容阅读
近年来,便携GPS设备的蓬勃发展使得我们可以轻易地收集到大量的时空轨迹数据,通过分析这些数据,我们可以发现隐藏在这些数据后面的秘密,从而更好地为我们的生产生活提供指导和帮助。本文的着眼点就是如何基于这些大规模时空轨迹数据进行离群轨迹的挖掘和检测。近年来,国内外在离群轨迹检测方面已经取得了许多的成果,但是这些研究主要存在两大不足之处:一、大部分离群轨迹检测算法的时间复杂度较高,只适合处理小规模的数据集,面对日益增长的大规模数据集无从下手;二、许多算法只考虑了空间上的离群,而忽略了时间因素对离群检测的影响,从而产生误判。本文为了解决上述两个问题,提出了基于带时间约束频繁路径的离群轨迹检测方法。此方法将空间离群与时间离群综合考虑,并且适用于大规模轨迹数据集的检测。此方法有两个主要任务:一、给定一个大规模时空轨迹数据集,要能够快速准确地找到这个数据集中所有的离群轨迹;二、基于一个大规模时空轨迹数据集,能够实时快速准确地判断一条当前正在行走的轨迹是否具有离群的趋势,并且当轨迹停止之后,如果此轨迹是离群的,需要指出此轨迹的哪个部分导致了轨迹的离群。针对上述的两个任务,本文分别提出了离线检测算法TPROO和实时检测算法TPROR。TPROO算法摒弃了两两轨迹对比的思想,而是采取了分组检测的思想,避免了大量不必要的计算,有效地缩短了离群检测所需时间。除此之外,TPROO中提出了一种带时间约束的轨迹编辑距离计算方法,充分考虑了空间和时间因素对离群检测的影响。TPROR在TPROO的基础之上进行了许多优化,增加了相关数据索引及缓存,使得TPROR算法更加适用于实时离群轨迹检测领域。本文提出的基于带时间约束频繁路径的离群轨迹检测方法,非常适用于大规模数据检测,并且充分考虑了空间和时间因素在离群轨迹检测中的影响。本文的研究成果具有重要的现实意义,对相关的研究工作具有一定的参考价值。