基于FPGA的卷积神经网络加速器关键技术研究

来源 :国防科技大学 | 被引量 : 2次 | 上传用户:kyuiyigjghj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,卷积神经网络已经成为机器学习领域最为流行的模型之一,在图像分类、目标检测、语义分割等各个领域都得到广泛应用并取得突破性进展。基于卷积神经网络的人工智能应用,分为训练和推理两个阶段的任务,两个任务都是计算密集型的,目前主要在高性能处理器或集群上运行,如服务器CPU和GPU。然而,过高的功耗不仅增加了数据中心的运营成本,还限制了人工智能应用在嵌入式设备、边缘计算设备等低功耗应用场景下的部署。因此,具有高能效比的卷积神经网络加速器设计成为新的研究热点。FPGA(现场可编程门阵列)具有高性能、高能效比、高灵活性等特点,非常适合作为加速器设计平台。本文针对基于FPGA平台的卷积神经网络加速器设计中的关键技术展开研究,包括不同的任务、不同的实现算法、不同的应用场景、不同的设计和实现方法。面向卷积神经网络的推理任务,本文第二章研究了基于常规空间卷积的加速器设计,深入分析了执行推理任务时每一层的计算特点和访存特点,并提出了加速器设计的并行框架,可以在任务级、层级、循环级和操作级四个层次上挖掘算法的并行性。执行网络模型推理任务时,针对不同的网络模型需要定制不同的加速器。我们提出了设计空间搜索算法,可以根据网络模型的结构参数和目标平台的资源约束情况,找出最优的加速器设计参数。随着网络模型变得越来越深,中间结果数据量持续增加,单个芯片的片上存储容量不足以支撑多个推理任务的部署,甚至不足以支撑单个推理任务的层间流水展开。此时,任务级和层级的并行性将会相继消失。为了更好的挖掘循环级和操作级并行性,本文第三章中研究了基于通用矩阵乘法的加速器设计,设计了高效的特征矩阵映射模块,消除了将输入特征图像转为特征矩阵时的数据膨胀,并采用二维乘累加阵列高效的执行矩阵乘法。该加速器还设置了以基本功能层为单位的宏指令集,可以支持对不同网络模型的推理任务进行加速。结合智能边缘计算端设备对低功耗、低成本的需求,同时兼顾性能和通用性,本文第四章中以典型的人脸检测与识别应用为例分析了边缘计算端人工智能应用的特点,提出了RISC-V处理器、卷积神经网络加速器和专用加速模块协同的异构处理器结构。卷积神经网络加速器沿用了第三章中的设计,结合边缘计算需求添加了芯片面积约束和访存带宽约束,同时丰富了宏指令集以支持更多的网络模型,并开发了自动化工具链方便开发者在边缘计算端快速部署基于卷积神经网络的人工智能应用。面向卷积神经网络的训练任务,本文第五章中研究了基于常规空间卷积的加速器设计,深入分析了训练任务在反向传播过程中每一层的计算模式,结合前向传播过程中各层的计算模式,设计了一致的计算引擎,并通过循环展开的方式挖掘算法并行性。此外,还设计了以层为单位的宏指令集,每一层在前向过程中的计算和在反向过程中不同梯度的计算都有对应的指令表示,支持以宏指令序列的方式执行不同网络模型的训练任务。
其他文献
总结5例颌面部外伤合并颈椎骨折患者手术后的护理。认为重视病情观察,加强进食指导、口腔清洁、颅骨牵引护理和预防下肢深静脉栓塞等,能促进患者康复。
当今艺术表现形式随时代的发展而愈发多元性,中国画从传统到当代也有了巨大的发展。纵观现状,诸多中国画重内涵而轻传统的笔墨形式,重材料而忽视精神追求。傅抱石是中国近代
材料微观力学性能测试以纳米压痕和划痕最具代表性,通过连续记录载荷-深度关系曲线,进而分析获取被测材料的硬度、弹性模量及粘附性等参数。该文提出一种压头固定,试件运动的
脑卒中又称脑血管意外,多数存活患者会遗留不同程度的运动、感觉、语言功能障碍,由于各种因素的影响,患者不可能在医院长期接受治疗,绝大多数患者病情稳定后带药回家,因此患者出院
角接触轴承的运行状况是机械部件能否正常运转、实现预定功能和达到预期寿命的关键环节。本文以应用于空间环境的角接触轴承为对象进行空间状态下轴承运行失效机理和状态的研
阻尼性能是Ti-Ni基形状记忆合金除形状记忆效应与超弹性以外的又一项重要力学性能,已经广泛应用于交通、建筑、机械、潜艇等领域以起到防振减噪的作用。Ti-Ni形状记忆合金的
目的 :分析用经皮椎间盘孔镜靶向穿刺术治疗腰椎间盘突出症的临床效果。方法 :将2015年2月至2016年1月期间成都军区八一骨科医院收治的92例腰椎间盘突出症患者随机分为试验组和
固定床反应器广泛地应用于气-固相催化反应,是化学反应过程的核心设备。本文借鉴螺旋板式换热器的结构特点开发了一种适用于气-固相催化反应的新型固定床反应器,并利用Fluent
目的:对比分析用自动痔疮套扎术(RPH)和吻合器痔上黏膜环切术(PPH)治疗Ⅱ~Ⅲ度直肠黏膜内脱垂的效果。方法:将2012年1月至2016年12月柳州市中西结合医院收治的96例Ⅱ~Ⅲ度直肠黏膜
虚拟现实(virtual reality,VR)是一种利用计算机模拟技术产生的三维虚拟世界。它作为一种革命性的交互方式,被普遍认为是5G的一个主要驱动业务。目前最为普及的VR应用是利用3