论文部分内容阅读
伴随着定位技术的发展以及智能移动终端的普及出现了大量的轨迹数据,轨迹数据蕴含着丰富的时空信息和语义信息,对轨迹数据进行有效存储和管理对城市建设和人们的日常生活等都具有重要意义。本文围绕轨迹数据存储和管理中的两个突出问题—轨迹数据压缩问题和轨迹数据发布中的隐私保护问题展开研究,主要贡献如下:针对在线轨迹数据压缩中压缩率和压缩误差之间的矛盾提出基于相对同步欧式距离筛选的在线轨迹数据压缩算法和基于动态同步欧式距离计算的在线轨迹数据压缩算法。前者以用户期望达到的压缩率为压缩依据依次将新产生的轨迹点存储起来,当压缩率超过用户期望的压缩率时借鉴TD-TR离线轨迹数据压缩算法的思想从当前存储的轨迹点中选择因轨迹点被删除而引起误差较小的轨迹点并将其移除。后者以用户给定的误差距离阈值为压缩依据,在计算轨迹点因被删除而可能引起的误差时不仅包含该轨迹点自身在被删除后引起的误差而且包含轨迹点被删除对其他非关键轨迹点的影响,在此基础上从轨迹中选出部分关键轨迹点进行存储。通过在真实轨迹数据集上的实验分别测试了本文所提出轨迹数据压缩算法的性能。实验结果表明本文所提出的轨迹数据压缩算法能有效缓解轨迹数据压缩中压缩率与压缩误差之间的矛盾。针对轨迹数据发布中的隐私保护问题提出一种基于轨迹多特性的隐私保护算法,首先通过轨迹在方向、速度、时间、空间4个特性的差异进行轨迹间相似性的度量,在此基础上进行轨迹聚类;然后以空间平移的方式实现轨迹的k—匿名,在满足一定隐私保护需求的前提下尽可能地提高匿名轨迹数据的可用性;最后通过实验测试了所提出的隐私保护算法在满足一定隐私保护需求的情况下在数据可用性方面的性能。实验结果表明算法在实现轨迹数据隐私保护的同时对数据可用性提供了一定保证。综上所述,本文对轨迹数据压缩及隐私保护算法的研究在一定程度上解决了轨迹数据存储问题中压缩率和压缩误差的矛盾,以及轨迹数据隐私保护发布中匿名数据可用性方面的问题,对轨迹数据的相关应用具有一定的现实意义。