基于出租车轨迹数据的并行化区域热点分析方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:yuming_wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,移动轨迹数据正成为研究热点,它为智慧城市以及研究城市计算的领域提供了重要的数据基础。出租车GPS轨迹数据的挖掘、分析与利用,为解决城市问题提供了新思路。本文基于改进的CLIQUE网格聚类算法和FP-growth算法对出租车GPS轨迹数据进行关联规则挖掘及应用。针对出租车热点区域推荐的问题,本文研究的主要内容及创新点如下:(1)使用基于高斯随机分布的自适应网格聚类算法(An improved CLIQUE based onGaussian Processes and adaptive division,GPAD-CLIQUE),改进了 GP-CLIQUE 算法的如下缺点:硬网格划分导致不当划分并破坏原始密集区域完整性的缺点,硬网格划分算法聚类结果对密度阈值非常敏感的缺点以及最小描述长度的策略剪枝导致密集单元不完整的缺点。并通过实验比较使用的GPAD-CLIQUE算法和基于高斯随机分布的CLIQUE网格算法以及CLIQUE网格算法对数据集进行网格聚类的结果,发现GPAD-CLIQUE算法在聚类结果中误码率相对较低,可靠性更高。(2)针对FP-growth算法需要扫描两次数据库才能构建FP-tree的情况,本文使用一种基于项集交叉子集的FP-growth算法,该算法只需扫描一次数据库即可构建FP-tree。基于项集交叉子集的运算特点来构建有序的频繁模式树,利用下一层结点信息包含上一层结点信息的改进FP-tree存储方法,只需扫描一次数据库即可挖掘频繁项集,并基于Spark框架对TCFPM算法、基于布尔矩阵的FP-growth算法、并行FP-growth算法进行对比实验,实验结果表明,TCFPM算法具有更高的加速比和更好的可扩展性。(3)对GPAD-CLIQUE算法和TCFPM算法的实验结果进行分析,分析停留点的统计结果,研究停留点的数量分布及变化与不同时间段内兴趣点分布的关系,和不同类别的兴趣点的变化规律以及不同时间段内被兴趣点影响的市民行为活动规律;对兴趣点进行聚类,将所有兴趣点划分成以兴趣点核心为圆心的集合,基于时间段和兴趣点的影响力综合为出租车司机推荐兴趣度集中的热点区域。
其他文献
受MEMS加工工艺等因素影响,振动环式微机械陀螺存在一定的不对称,引起检测端的同频干扰,导致检测信号的信噪比降低。通过对振动环式陀螺进行激励模态和检测模态的动力学分析,研究
尾状核头部梗死国内报道较少,为探讨其临床特点以进一步提高对该病的认识,现对我科2008-10—2012-12收治的8例尾状核头部梗死患者的临床资料进行总结分析。
寒证包括表寒、里寒、虚寒和实寒等。表寒留于肌表,留著关节而致痹病;里寒之邪直中脏腑,伤肾入骨,致骨重不举,瘦削疼痛,久而关节肢体变形,成为痹难愈之疾;虚寒则阳气推动无力
本文以外研版英语三年级起点教学为例,论述核心素养视角下开展小学英语绘本阅读教学的途径,分析英语绘本阅读教学的意义,明确培养学生英语学科核心素养对小学英语阅读的要求,
为获取我县玉米测土配方施肥参数,农技站在全县不同肥力地块完成了10个玉米氮、磷、钾三因素四水平肥效试验。试验分析结果:全县平均最佳施氮量尿素为40.2公斤/亩、施肥三料
<正>教学目标1.情感与态度。体会生活中的快乐无处不在,懂得快乐就是分享,知道帮助别人就是帮助自己;给人快乐,自己也获得快乐。2.行为与习惯。
基于目标物体抓取机械手的结构和运动特点,运用D-H方法建立该五自由度机械手的运动学方程并求解,运用Pro/E三维建模功能对该机械手进行实体建模,再利用ADAMS软件仿真功能进行