可重构卷积神经网络加速器设计与实现

来源 :传感器与微系统 | 被引量 : 0次 | 上传用户:wind2121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对卷积神经网络(CNN)中卷积核的多样性导致加速器难以实现高效计算的问题,提出了一种可重构卷积神经网络加速器实现方法.加速器包括18个处理引擎(PE),每个PE包含9个乘累加单元,3个PE构建一个5×5卷积核实现卷积核重构,调度器通过控制每层所需的卷积核大小和通道数分配PE实现卷积处理.加速器支持常见的3×3,5×5卷积核的网络模型,加速器采用数据复用以及并行处理的设计方法,有效降低了存储访问次数,提高了加速器的计算高效性.通过对AlexNet进行验证,实验表明:使用XC7Z045平台在150 MHz的工作频率下,能效比可以达到16.89 GOP/s/W,相比于当前典型设计,能效比分别有410%,270%,78%,19%的提升.
其他文献
基于地磁传感器的物联网(IoT)感知技术被广泛应用于列车定位导航、速度监测和安全控制等场景中.然而,半导体材质温度敏感性影响到地磁传感器量测数据的精准性.在充分考虑铁路物联网感知设备能量和资源受限性的基础上,提出基于最小二乘法多项式曲线拟合构建轻量级温度补偿机制,以此提升地磁传感器铁路物联网感知设备在复杂环境下的稳定性.实验表明:所提温度补偿机制具有资源占用率低、微能耗和精准性高等特性.