数据并行相关论文
随着机器学习领域的不断发展,用于机器学习的模型变得越来越大,用于训练的样本数据量不断增多。这两种变化导致了单台计算机在执行......
深度神经网络(Deep Neural Network,DNN)并行化已成为高性能计算领域一个热点问题,也是解决大规模模型训练缓慢的最佳方法之一。然而......
针对深度学习图像分类场景多GPU并行后传输效率低下的问题,首先提出一种时间复杂度更低的Ring All Reduce改进算法,通过分节点间隔配......
随着人工智能的飞速发展,机器学习逐渐趋向于大数据、大模型、大规模集群训练,这在加强机器学习能力的同时也对机器学习策略提出了......
随着机器学习算法模型规模和数据量的高速增长,单个节点不能够有效的承担大规模训练所需的计算和存储需求,因此在分布式集群中运行......
聚类是数据挖掘领域中的一个重要研究课题。随着聚类分析对象数据集规模的急剧增大,改进已有的算法以获得满意的效率受到越来越多的......
流体系结构是近年来提出的一种源于媒体处理的高性能体系结构。这种结构针对流媒体应用的计算、访存和通信特征,采用大规模的运算阵......
SIFT(Scale Invariant Feature Transform)特征在物体检测和识别、图像配准与融合、纹理识别、场景分类、人脸检测、图像检索、三......
目的:系统评价低分子肝素(low molecular weight heparin,LMWP)治疗急性胰腺炎(acute pancreatitis,AP)临床疗效。方法:计算机检索......
内存不足是蒙特卡罗方法大规模输运模拟的关键问题。对于反应堆燃耗分析,需在输运过程中统计大量反应截面数据,计算机内存限制了燃......
[目的]本文主要就大数据基础理论及系统相关研究背景、技术架构和关键技术展开介绍,并结合技术发展趋势提出未来研究和技术发展方......
数据并行计算在气象、地质、国防等重大领域中发挥着重要作用,进行数据并行计算的研究,对于提高我国综合国力有着非常重要的意义。本......
为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响G......
针对异步随机梯度下降算法在多核系统和主/从集群环境中的通信冲突问题,提出了异步双随机梯度下降算法.该算法主要通过离散各从节点在......
HPF(high performance Fortran)是一种典型的数据并行语言,HPF编译系统的实现是并行计算研究领域的一个难点.文章介绍了一个HPF编......
在分析MPP结构的基础上,探讨了适宜MPP的消息传递方式的两种并行程序设计方法,介绍了数据并行程序设计方法应注意的问题,以及并行......
针对并行训练算法面临的诸多问题上,提出了一种并行分布式训练模型.该模型采用主一从机结构,通过数据片split迭代得到数据块block,......
深度学习并行化在加速模型训练、提高预测精度等方面具有重要作用。文章从数据并行、梯度累积算法两方面对深度交通时间预测模型(T......
从应用的角度建立了评价大规模问题数据并行处理性能的模型,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能,......

