基于KD树划分的云计算DBSCAN优化算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:wwwboy2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在并行RDD-DBSCAN算法的数据划分和区域查询过程中会对数据集进行重复访问,降低了算法效率。为此,提出基于数据划分和融合策略的并行DBSCAN算法(DBSCAN-PSM)。利用KD树进行数据划分,实现数据分区与区域查询步骤的合并,从而减少数据集的访问次数以及降低I/O过程对算法效率的影响。采用判定数据点自身属性的方式,对标注为边缘点的数据进行融合,避免全局标记的额外时间开销。实验结果表明,DBSCAN-PSM算法相比RDD-DBSCAN算法可节省18%左右的运行时间,适用于处理海量数据聚类问题。
其他文献
针对不同通信设备之间的互连互通、软硬件升级困难等问题,为提高组件的可移植性和共享性等特点,根据新型异构平台结构,设计一种信号处理平台的可重构组件。借鉴GNU Radio平台