【摘 要】
:
如何构造有效的稀疏近似逆预条件子用于加速求解线性方程组的迭代方法的收敛性一直都是科学计算中的重点关注问题。随着计算机计算能力的提高,人们探讨问题的深度和广度也逐渐增大,要求必须提高线性方程组的迭代求解效率。人们发现虽然稀疏近似逆能有效提高迭代方法的收敛性,但是构造大型稀疏矩阵的稀疏近似逆非常耗时。近年来,随着图形处理单元(Graphics Processing Unit,GPU)的发展及其编程模型
论文部分内容阅读
如何构造有效的稀疏近似逆预条件子用于加速求解线性方程组的迭代方法的收敛性一直都是科学计算中的重点关注问题。随着计算机计算能力的提高,人们探讨问题的深度和广度也逐渐增大,要求必须提高线性方程组的迭代求解效率。人们发现虽然稀疏近似逆能有效提高迭代方法的收敛性,但是构造大型稀疏矩阵的稀疏近似逆非常耗时。近年来,随着图形处理单元(Graphics Processing Unit,GPU)的发展及其编程模型(Compute Unified Device Architecture,CUDA)的成熟,如何基于GPU设计高效的稀疏近似逆预条件子引起了研究者们的广泛关注。基于此背景,本文面向GPU,对如何加速构造高效的稀疏近似逆预条件子进行了深入研究,主要工作和贡献如下:1.提出了一种静态的基于GPU自适应线程分配的并行稀疏近似逆预条件算法SPAI-Adaptive(Adaptive sparse approximate inverse)。在SPAI-Adaptive中,首先确定稀疏近似逆预条件子的稀疏模式,本文采用的是和系数矩阵A相关的稀疏模式确定方法;然后分初始化、计算阶段和组装阶段三个阶段分别设计并行算法,每个线程组计算预条件子的一列。为提高并行效率,根据矩阵的自身特点,提出了自适应分配线程的策略。通过和现在流行的并行稀疏近似逆预条件算法进行比较,结果显示本文提出的SPAI-Adaptive优于它们且有着更好的并行性。2.提出了一种动态的基于GPU并行稀疏近似逆预条件算法DFSPAI。相比静态稀疏近似逆预条件算法,DFSPAI(Dynamic fast sparse approximate inverse)的稀疏模式是在计算过程中动态确定的。首先确定预条件子每一列的非零元素的填充上限,并且设定初始预条件子为对角线模式,计算初始的I、J、QR、mk和rk,接着根据残差向量rk计算可添加的列,然后在M中填充相应的非零位置,更新相应的I、J、QR,计算新的mk和rk,直至残差范数||rk||2小于设定的阀值或者非零填充数达到上限。实验结果显示DFSPAI取得了良好的效果。3.把提出的两种并行构造预条件子的算法应用到求解实际的稀疏线性系统Ax=b中。一方面验证本文提出的算法构造的稀疏近似逆预条件子的有效性;另一方面从多角度分析这两种算法之间的优缺点。
其他文献
2,7-二甲基-2,4,6-辛三烯-1,8-二醛是合成各种类胡萝卜素的关键中间体,本文选择以1,4-丁烯二醇、氯化亚砜、1,1-二甲氧基丙酮、亚磷酸三乙酯为主要原料,通过氯代、异构化、缩合、Wittig-Horner反应、水解五步反应合成该中间体。本文通过系统的单因素实验研究,得到各步反应的优化工艺条件如下:第一步氯代反应,以1,4-丁烯二醇和氯化亚砜为原料反应得到顺式1,4-二氯-2-丁烯。最佳
车道线保持是自动驾驶系统中的重要组成模块,本文基于深度学习方法直接应用低成本的单目视觉传感器来实现智能车的转向控制,进而实现自动驾驶。传统的车道线检测方法容易受到光照变化、天气变化、遮挡、阴影以及车道线破损等方面的影响,这为基于图像分割和边缘检测的算法带来了严峻挑战,最终会导致人工设计的特征检测模型鲁棒性和泛化性严重下降。近些年深度学习由于其强大的逼近高度非线性函数的能力被广泛的应用于各个领域,而
本文研究了《中华人民共和国野生动物保护法》中法律条文的语法结构和语义特点,利用分词技术,提取了法律条文中包含的动词、名词等林业专业术语,构建了基于动名词的近义词、同义词词库和父子级层次关系词库。建立了林业法律智能检索模型,采用语义信息检索中计算词语相似度的方法实现了检索的智能化。采用改进的正向最大匹配切分算法,结合语义分析,把父子级层次检索方式和词语相似度计算检索方式结合起来,以相同的检索语句作为
随着智能科技的迅猛发展与社会智能信息化程度的加深,数据作为信息的载体已经演变成一种核心资产。然而伴随着个人隐私的泄漏,数据内容被破解等安全问题日益涌现,计算机数据安全问题越来越受到人们的重视。DDR是非常通用的易失性存储器,很多芯片系统中的模块诸如CPU、DMA、CE等都会对DDR进行访问,主要进行着数据存储和读取等工作。因此DDR存储系统在数据安全保护中起着关键作用,该系统也往往会成为恶意攻击者
人工智能已经当仁不让的成为了当前学术界最火热的研究方向,各个领域不论是医疗、生物、互联网都已经开展了相关的各类工作。显然如今人工智能对于大部分人已经不再神秘,人们对于它的要求也已经越来越高,已经从‘可以做’转变为‘可以做得好’。为了更好地探讨人工智能在各个领域的有效性,本篇论文将从两个方向展开工作,包括人脑肿瘤图象识别与多特征时间序列的异常检测。人工智能应用到医疗图像分析在过去几年已经成为了比较火
随着“十三五”期间我国对能源密集型产业的调控以及持续改进能源结构工作的推进,我国煤炭消费增速正在变缓。在一次能源消费占比中,煤炭消费量的比重也逐年下降。虽然受到经济形势下行以及化解过剩产能等宏观环境的影响,我国仍然是全球最大的煤炭生产国与煤炭消费国,煤炭依旧是我国能源结构中消费比重最大、使用时间最长的常规能源。但随着社会对煤炭需求量的增长,煤炭企业生产所需物资逐年上升,再加上煤炭企业物资种类繁多,
随着医疗信息技术的快速发展,重症监护室(Intensive Care Unit,ICU)集中越来越多的监护设备。目前临床监护设备的异常报警功能通常使用阈值检测法,采用多参数联合的超限报警以提升报警准确率。然而ICU误报警率依然很高,严重影响ICU治疗监护效果,这其中尤以心电监护仪误报警占主要。近几年,人们对综合使用ICU中多种生理监护数据以降低心电监护仪的误报警率的兴趣不断增加,随着生理信号分析算
隐通道是一种通信信道,随着计算机网络的普及,人们将隐通道和计算机网络结合,在正常的网络通信中,隐通道可以穿透传统的安全防火墙,难以被检测。因此能够在军事、企业等领域传输隐秘信息。本文对传统的包排序隐通道进行分析,提出了基于改进包排序的隐通道模型研究与应用,本文的研究内容如下:第一、针对包排序的隐通道数据没有校验的问题,提出了基于包排序隐通道的数据校验模型。推导了本模型中端口的排序、每个端口发送数据
随着时间的推移,我国老龄化的程度不断加重,受城镇化的不断发展以及城市对农村青年人口的虹吸影响,农村人口老龄化问题将比以往更加突出。同时土地功能弱化、子女外出务工、支付能力有限、养老服务供给不足等因素更是制约农村养老服务的发展,尽快完善和解决农村地区老年人的养老等一系列问题关系到我国经济社会的高质量发展,也是我们当前遇到的突出问题之一。2009年9月,国务院颁布了《关于开展新型农村社会养老保险试点的
互联网的发展带动了图像、音频与视频等多媒体产品的出版与传播,但随之而来的信息安全问题困扰着每一个多媒体信息的使用者。作为信息安全最重要的组成部分,视频信息在存储与传输中的安全性一直是人们关注的焦点。在视频的存储与传输中信息常以编码的形式存在,其中应用最广泛的开源标准就是采用了混合编码的H.264/AVC编码标准。以此为背景,在H.264的编码标准下通过数字水印实现对视频信息的保护成为最具价值的研究