基于国产众核架构CESM中有限差分计算优化

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:fogflower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对CESM中的有限差分算法并行过程中存在内存读取冗余过大、通信开销过高的问题,设计出根据数据结构进行数据重构、计算核心捆绑、流水线通信等多种并行优化方案。弥补了申威26010处理器在数据读取过程中缺少共享缓存区、带宽利用率不高等不足,缓解了申威26010处理器在有限差分法求解过程的通信瓶颈。对CESM中以有限差分法为核心计算的两个函数,在申威26010众核处理器上的测试结果表明,提出算法及优化策略拥有21.2倍的性能提升。
其他文献
针对支持向量引导的字典学习(support vector guided dictionary learning,SVGDL)的鉴别约束项只体现了大间隔原理,而没有很好地利用数据空间内在结构信息的问题,提出了一种新颖的鉴别性字典学习方法——基于局部类内结构的鉴别性字典学习方法。该方法结合了大间隔原理和局部Fisher线性鉴别分析作为鉴别约束条件来指导指点学习。通过建立一个局部类内散度矩阵来编码数据空
目的探讨血清胱抑素C水平对妊娠妇女妊娠期高血压疾病的发生及妊娠结局的影响。方法采用回顾性方法选取2016年1月-2018年6月在昆明市妇幼保健院产科入院分娩的产妇为观察对象
青海云杉由于有着更高的耐寒属性,在种植之后,其树干有着较高的质量,因此在一些环境恶劣的地区进行种植,能够起到改善周边环境的作用。主要针对青海云杉种植过程中的具体栽培
针对容积伺服电液作动器位置高精度控制问题,建立电液作动器位置控制数学模型,提出三状态反馈与三状态顺馈控制策略。该控制策略通过三状态反馈补偿系统固有频率和阻尼比,并
大数据时代低频采样交通轨迹数据呈指数级增长,准确、高效地对复杂路网中产生的海量低频浮动车数据进行地图匹配对出租车载客热点和路线推荐具有重要意义。基于上述考虑,提出了一种基于曲线拟合的改进算法,对缺失的轨迹数据和路网数据分别使用插值和均值化的方法进行补全,利用Geohash技术对路网和轨迹数据进行存储和搜索,充分考虑车辆速度和道路限速因素,使用轨迹点后向向量和路段向量对路候选段进行分析,设计综合评价
通过对园林绿化施工中苗木种植存在的问题进行分析,并且从种植和养护两方面提出了有效解决措施,以期为林业人员提供参考性建议。
目的对应用微信平台干预口服抗病毒药物治疗的慢性病毒性肝炎患者的依从性进行观察及评价。方法选取我院诊断慢性病毒性肝炎并口服抗病毒药物治疗的患者,随机分为干预组和对
针对轴颈倾斜下水润滑橡胶径向轴承动力学建模问题,提出了32系数动力学模型,建立了弹流润滑模型,采用差分求解方法求解了8系数模型和32系数模型下的轴承动特性,分析了偏心率