【摘 要】
:
随着计算机算力突破性的提升,卷积神经网络(CNN)已经成熟应用在安全监控、语音语义识别、图片分类、目标识别、智能控制等领域。近年来,神经网络的训练和推理的主要使用平台是GPU,但GPU平台价格昂贵、功耗较高、不适合嵌入式等微型设备,而FPGA平台具有并行高速运算、功耗低、价格一般、适用于微型设备等特点。因此,基于FPGA的卷积神经网络加速平台应运而生。本文首先介绍了CNN卷积神经网的各层结构,包括
论文部分内容阅读
随着计算机算力突破性的提升,卷积神经网络(CNN)已经成熟应用在安全监控、语音语义识别、图片分类、目标识别、智能控制等领域。近年来,神经网络的训练和推理的主要使用平台是GPU,但GPU平台价格昂贵、功耗较高、不适合嵌入式等微型设备,而FPGA平台具有并行高速运算、功耗低、价格一般、适用于微型设备等特点。因此,基于FPGA的卷积神经网络加速平台应运而生。本文首先介绍了CNN卷积神经网的各层结构,包括卷积层,池化层,全连接层等等,分析了现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)加速CNN的可行性与优势。根据卷积神经网络中多个卷积核并行运算的特点,结合FPGA平台适合高速并行运算优势,提出使用FPGA加速卷积运算部分的方法。其次,根据卷积运算复用的特点,采用数据复用方式,并根据硬件资源大小划分卷积运算的并行度。然后,针对纯FPGA结构适合并行加速运算但不擅长嵌入式控制问题,提出了一种异构加速方法,采用ZYNQ系列的FPGA,该芯片是ARM+FPGA结构,将神经网络分成卷积运算和全连接运算两个部分,使用FPGA端加速并行度要求高的卷积运算部分,ARM端完成运算控制、数据传输和全连接层,这种异构加速方式大大缩短了开发周期、降低了开发难度。另外,实验结果表明,该方法既可以提升速度又具有通用性。最后,以数字手写体为例,在ZYNQ平台的FPGA端搭建复用的卷积运算模块,在ARM端搭建控制模块及全连接层运算模块,实现了卷积神经网络设计。经验证异构加速平台可以完成数字手写体的识别,整个算法工程的功耗为1.856W,一张图片的运算时间为87us,准确率为91%,实验结果表明本加速平台在保证其准确率的同时,具有更快的速度、更低的功耗并具有通用性,和其他平台相比显然本平台更适合加速卷积神经网络。
其他文献
智能纺织品是一种典型的智能材料,它能够感知各种来自环境的变化或刺激(如力、电、光、磁、热及化学环境等),并做出响应,目前已被广泛的应用于探测传感、航空航天、医疗保健、以及运动娱乐等领域。与传统的传感器相比,织物基传感器具有可拉伸、可弯曲、可穿戴、可折叠及可洗涤的特点,更适合于非平面结构的使用,且织物基传感器弹性好,作为应变传感器使用时比传统的金属应变片工作范围更广。但是目前的柔性应变传感器存在灵敏
随着信息技术的快速发展,高功率的电磁辐射造成的环境污染问题引起人们的广泛关切。现有的屏蔽体材料(金属板)存在着比重大、柔性差等缺点,难以满足诸如轻量、可穿戴等复杂应用需求。而普通纺织材料的电磁学参数不能达到如金属、半导体所具有的数量级,不具备任何电磁功能。如何设计轻质多孔的电磁干扰屏蔽材料以满足与可穿戴电子相关的应用领域已经成为当前研究的热点。本文使用湿化学法、磁控溅射和冷冻干燥等技术得到了具有轻
智能纺织品在个人体温管理、可穿戴人体运动监测和医疗保健等方面的潜在应用受到越来越多的关注。由于纺织品固有的亲水性导致纺织品易被污染,给实际使用带来很多不便。同时,柔性可穿戴纺织品在实际使用中容易受到机械和微生物的攻击,如出汗、磨损、弯曲、细菌交叉感染等。因此,如何制备具有防水、电热响应、机械敏感和抗菌性能的多功能电子纺织品仍是一个挑战。本文对多功能电子纺织品的研究进展进行综述和分析,以具有柔软、透
碳量子点(CQDs)作为一种新型荧光纳米材料受到广泛的关注。由于其具有水溶性好、毒性低、制备简单以及独特的光学性质被广泛地应用在生物/化学传感器、光催化和细胞成像等领域。鉴于CQDs在紫外光区具有很强的吸收能力,因此可用作棉织物防紫外线整理剂。本文采用水热合成法合成了三种不同碳源的硼氮共掺杂碳量子点(BN-CQDs),表征了所制备BN-CQDs的结构和光学性质,并通过表面喷涂-碾轧和棉织物纤维素改
水玻璃砂是最环保的型砂之一,在铸造型砂中,水玻璃砂最有可能实现无公害化,符合21世纪对环保绿色生产制造的需求。在传统的型砂铸造工艺中,复杂模具设计加工工艺流程比较复杂、产品的研发周期长,企业的生产成本高。随着微波装备和三维打印的快速发展,微波无模硬化水玻璃砂工艺实际应用已成为可能。三维打印-微波硬化打印原理是:铺平一层一层的原砂,使用液态水玻璃作为粘结剂并通过喷嘴一层一层的粘结原砂,然后微波硬化。
提升黄河流域城市能源利用效率既有助于实现"碳达峰"和"碳中和",又有助于黄河流域生态保护和高质量发展。基于非径向方向性距离函数、非径向Luenberger指数及分解项、Tobit模型探讨了2003-2018年黄河流域城市能源利用效率的时空特征、内生驱动机制与外部影响因素。研究发现:2003-2018年间黄河流域城市能源利用效率整体上表现出波动上升态势,且能源利用效率的增长主要来自能源经济效率的改进
针对现有针织机械,难以进行大幅度的效率提升的问题,本文打破传统针织机械的织针驱动原理的限制,提出了一种新型电磁阵列式的混合磁悬浮织针驱动方法,通过测量织针的上升高度,实时的控制并改变电磁线圈加载的电流大小、方向和机头的横向位移,进而使织针能根据设定的编织工艺动作。本文通过研究电磁线圈和永磁铷铁硼的空间磁场分布规律,分析永磁织针与电磁线圈的混合磁悬浮驱动系统中永磁织针运动高度与电磁力的关系,获得永磁
随着时代的进步,纺织材料与纺织技术发展迅速,纺织品不仅仅局限于服装和装饰,各种功能性需求也随之而来。非织造布作为纺织产品中的一个大类,市场占比逐年增加,高速发展的非织造产业也凸显出来一些问题,由于产品大多属于易燃物和可燃物,引发火灾或者导致火势蔓延的问题日益受到人们的关注。涉及人民生命财产安全的问题不容忽视,因此世界各国也对纺织产品做出了一系列关于纺织品阻燃要求的相关条例法规。本文对缝编非织造布性
采用SBM-Undesirable模型测算了1999—2017年中部六省的碳排放效率,分别计算了产业结构合理化指数和高级化指数,利用耦合协调模型考察了碳排放效率与产业结构优化的耦合协调度,并对其影响因素进行了实证分析。结果表明:中部六省碳排放效率和产业结构合理化的耦合协调度较低,处在中度失调和中度协调之间,碳排放效率和产业结构高级化的耦合协调度处在中度失调和中度协调之间,但有明显上升的趋势。人力资
本文主要研究偏序集的连通性.有两大方面,一是在有限偏序集上,给出连通的定义及性质.另外是在偏序集上定义连通的概念,并给出连通的一些性质.事实上,后者是前者的推广.首先引入并考察步集,利用步集作为工具建立(有限)偏序集元素间的连通关系.此外,在(有限)不交并偏序集上给出分支、可分分支、不可分分支等概念.指出真通集、非连通偏序集、不交并偏序集三者在结构上的联系.最后讨论有限偏序集与偏序集连通性的相容性