基于CUDA的地图代数局部算子的并行加速算法

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:X22521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着GIS技术的日益发展,GIS数据的数据量也随之增大。图像数据处理应用的主要问题不再是数据源的不足,而是如何快速、准确地从中提取更加丰富和有用的信息。本选题的研究目标是在CUDA架构下,针对局部函数算法所具有的数据处理流程相对固定的特点,选取具有并行性的局部算子,将传统的串行局部函数算法映射到并行处理架构上,从而实现栅格数据在CUDA并行编程模型上的加速算法。通过研究这一技术,我们可以将它应用于海量级数据的处理,利用其并行加速优势加速处理传统耗时的地图数据。   地图代数(Map Algebra)是一种以栅格点集的变换和运算来解决地理信息的图形符号的可视化和空间分析的理论和方法,它是帮助栅格数据空间分析的语言。地图代数的操作对象既可以是简单的栅格数据集,也可以是一系列栅格数据集;操作方式既可以是逐位操作,也可是多层栅格数据集的叠加。因此,栅格数据更能适应全球环境下的大范围多维、多源空间信息数据的动态分析。   本文首先介绍了CUDA架构,详细说明了CUDA的编程模型,CPU+GPU的异构并行架构原理。   通过结合ARCGIS空间分析模块,对地图代数中局部算子描述进行了算法研究,实现其在CPU下的串行计算模块。然后基于地图代数局部算子的特点,依据并行计算中计算问题表现的特征进行了算子的筛选,为下一步CUDA的并行设计做好了铺垫工作。   接着,本文针对局部算子能在任何CUDA设备上计算运行,但它的执行速度很大程度上取决于每个设备的资源约束的特点。在进行CUDA编程的时候,通过探索CUDA存储器特点,SM动态划分原理,数据预存技术以及根据硬件条件自动分配计算空间的研究来寻求一种能够合理的映射策略来尽可能的减轻资源的限制,提高程序运行的性能。   最后,本文按照局部函数的分类,围绕局部函数的每个算子展开基于CUDA编程模型的并行映射研究与实现,并给出了相同栅格数据在CPU和GPU两种架构下的时间复杂性的比较;最后在对比较结果进行分析的基础上,提出了适合并行算法实现的改进策略。   综上所述,高性能计算环境CUDA作为一个全新的软硬件架构,把GPU视为一个并行数据计算的设备,成功的将GPU的高计算能力充分开发了出来。这也预示着CUDA将会引领高性能运算的革命。
其他文献
网格门户极大地方便了人们对网格资源的使用,但在传统的网格门户中,大多只支持单次提交一个作业的传统使用模式,对自动化的大批量作业同时提交的使用方式并没有很好的支持,也没有
当前的在线数据存储系统面临互联网应用带来的新型负载,具有规模大,并发度高,形式变化丰富的特点。以往一般使用关系型数据库作为在线数据存储系统,但当面对新型特点的负载时
时间同步技术是网络应用的关键支撑技术之一,时间同步保证网络节点之间时间一致,其主要考虑两方面因素,时钟偏差和时钟漂移。在计算机网络中,主流的时间同步协议是NTP(Networ
为了满足在轨服务、编队飞行、天基目标近距离观测等空间任务对于高精度实时定位与定速的需求,提高航天器自主导航能力,扩展GNSS技术在空间段的应用领域,需要开展基于GNSS的空间
学位
聚类分析是数据挖掘中的核心技术之一。随着互联网的发展,现实世界中的数据量呈现爆炸式地增长,这导致传统的集中式聚类技术在面对大数据时无法有效地处理。随着MapReduce框
近年来无线传感器网络在许多领域有着巨大的应用前景因而受到广泛关注。将一组传感器节点布局在指定区域,节点通过其装备的无线电装置和能量互相通信,由此构成一个无线传感器网
进入21世纪以来,我国城市化发展不断加快,城市公路交通系统的压力不断加大,交通拥堵、事故等日益频繁,逐渐成为经济和社会发展中的全球性问题。交通事件自动检测系统(Automat
随着信息技术的发展以及业务的增加,分布式基础设施系统的规模越来越大,出现大规模的分布式基础设施系统。大规模分布式基础设施系统的带来好处的同时,也推出了挑战。由于规模大
随着科研进程的加速,科学家对信息的依赖也比以往任何时候突出。因此,科研信息日益成为具有战略意义的资源,能否有效利用科研信息将成为科研信息化推进的关键因素。与此同时,随着