深度学习模型二值量化方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhangjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习在许多领域取得了突破性的进展,然而,以应对日趋复杂的人工智能场景,深度学习模型的计算与存储复杂度逐渐提高,对于计算资源与功耗的需求显著增大。由此,当前应用于嵌入式等资源不足的设备上的深度学习程序通常向服务器端(云端)请求得到计算服务。然而,这种依赖于云端的模式存在数据传输成本、时延与稳定性、特别是隐私担忧等挑战。而将深度学习模型的计算部署到嵌入式设备上成为主要解决方式。因此,如何对深度学习模型进行压缩与加速成为一个研究热点。其中,二值量化神经网络以其极低的参数存储以及高能效的位运算方式等优势引起了较大关注,并取得了一定研究进展。然而,当前二值神经网络仍然存在如下挑战。一方面,极致的二值量化使得神经网络表达能力下降、准确度降低。另一方面,当前二值神经网络结构不够高效,仍然有进一步压缩的可能。针对上述的问题,本文以图像分类任务为应用场景,提出了两种对应的方法。就准确度而言,提出了一种新型自适应量化方法,减少了网络准确度损失;针对复杂度问题,提出了一种紧凑二值神经网络,在不损失网络准确度的情况下,进一步降低了网络的计算需求。本文的主要贡献如下:(1)提出了一种自适应可学习的二值量化方法。针对当前二值量化方法存在的不足,提出使用一个带参数的神经编码器代替传统使用的符号函数用于神经网络权重参数量化,该编码器可以在训练中学到更优的量化策略。根据权重通道内元素的相关性,设计了两种神经编码器。借鉴于知识蒸馏的思想,引入分布损失进行二值神经网络训练。通过最小化最终的损失,二值神经网络与神经编码器可以端到端训练更新。实验表明,提出的方法可以有效的减少网络的准确度损失,在ImageNet数据集上,相比于基准网络提升1.9%的Top-1准确度,相比于最新研究可以提升1.4%的准确度。同时,该方法可以提高二值神经网络训练的稳定性与速度。(2)提出了一种紧凑二值神经网络(MicroNet)。针对当前二值神经网络存在的计算复杂度问题,引入了一种轻量化卷积结构,分析了直接二值量化存在的问题,设计了一种信息增强二值卷积模块,其中包括添加旁路残差连接,以及使用分组卷积替换深度卷积。由此减少了二值量化导致的信息损失,并且通过控制分组卷积的分组数,得到准确度与计算复杂度之间的平衡。最后,根据信息增强模块,构建了紧凑二值神经网络:MicroNet。实验表明,相比于传统二值神经网络,MicroNet可以在相近准确度的情况下,取得更低的计算复杂度。
其他文献
乳腺癌是女性中最为常见的癌症之一,正严重危害着女性的身体健康。基于乳腺组织病理图像的分类识别是乳腺癌诊断的金标准。基于深度学习的分类模型能够自动地挖掘原始图像中所蕴含的重要信息,而不再依赖于细胞分割和人工特征提取,具有较强的分类识别能力,被广泛应用于乳腺组织病理图像的自动分类中。然而,深度模型往往只研究图像的单一特征空间,依据抽象的语义信息来进行分类。细胞是复杂且多样的,单一的深度特征表征能力有限
信用卡支付在在线支付上占有重要地位,各大商户都在竭力争夺接入信用卡支付渠道,抢占信用卡支付市场。但是信用卡支付渠道的接入效率却一直不够理想,原因包括渠道地区覆盖率、费率影响、安全性能以及用户体验等多种外在因素,还有开发过程中的模块复用率不高、重复联调测试、快速迭代过程中遗留问题过多等内在因素。首先对已有的信用卡支付渠道公司、信用卡支付方案等进行调研、梳理,分析现有系统的不足以及解决方案。提出设计信
近十年来,随着技术的发展以及生产力的提升,基于闪存的固态盘得到了井喷式的发展。相比磁盘而言,固态盘的读写速度快、抗震动、无噪声、低功耗,迅速成为了家用电脑、笔记本电脑等设备中首选的存储方案,也在企业级数据中心得到了广泛的应用。为了提高存储系统的容量并保证数据的可靠性,越来越多的企业用户使用固态盘阵列来存储数据。但固态盘不同于传统的机械磁盘,固态盘不能对数据进行原位修改,并需要定期对数据块进行垃圾回
石墨烯由于其广阔的应用前景,在过去二十年成为纳米材料科学领域的研究热点。在对石墨烯进行广泛研究的同时,近年来,包括TMDs、MXene、g-C3N4在内的其它二维类石墨烯材料也引起了人们的极大研究兴趣,其中二硫化钼、磷烯等二维无机类石墨烯优异的析氢性能受到了普遍关注。据此,本文运用密度泛函理论研究了不同类石墨烯材料体系的基本物理化学性质以及其在电催化析氢上的应用。论文首先研究了2H相二硫化钼中硫空
城市轨道交通系统在促进城市经济和社会可持续发展、缓解城市交通拥堵等方面发挥着十分重要的作用。随着城市轨道交通系统的快速发展,对地铁隧道施工技术尤其是盾构隧道施工技术的改进和研究也越来越重要。开挖面稳定是保证盾构安全施工的关键环节,尤其是在高渗透性的圆砾地层,泥浆成膜困难,开挖面稳定难以控制,因此研究圆砾地层泥水平衡盾构泥浆渗透成膜特性及开挖面稳定性问题很有现实意义。本文依托南宁地铁3号线泥水盾构穿
Bi24O31Br10作为一种新型光催化剂,具有优异的二维层状结构、适宜的带隙能和良好的稳定性,在光催化领域引起了广泛关注。然而,由于自身较低的光生电子-空穴分离效率以及对可见光较低的利用率,使Bi24O31Br10半导体的光催化性能受到抑制。因此,本文基于对Bi24O31Br10光催化材料进行改性,采用溶剂热法和室温化学沉积法构建新型异质结复合光催化剂,利用多种表征手段研究复合光催化剂的形貌、组
自动驾驶技术重塑了人们对于出行的认知,具有极大的社会价值与经济价值。车辆检测作为自动驾驶技术的基础方向之一,为后续防撞预警系统提供了技术支撑,成为当前研究的热点。然而夜间亮度低,路况复杂,车身轮廓不明显,现有车辆检测手段存在一定的局限性。针对此问题,本文提出两类基于视觉的夜间车辆检测方法:基于车尾灯配对的算法和结合Mobile Net v2与YOLO v3的深度学习算法。在夜间行车过程中可有效辅助
高职院校发展型学生资助管理工作还处于探索上升期,资助规章制度建设不完善,缺乏科学系统的顶层设计;未设立相对独立的学生资助管理中心;资助工作队伍建设不完善,兼职工作人员流动性大;发展型资助育人理念滞后,资助育人缺乏长效机制,资助管理工作缺少人文关怀。本文对广东W职业学院发展型学生资助管理现状进行实证研究,对高职院校发展型学生资助管理工作中“精准资助”和“资助育人”问题进行定量与定性分析,提出了针对高
空间众包(Spatial Crowdsourcing,SC)是众包中一种主流的类型。在空间众包中,空间众包任务都与地点/区域相关联,并且只允许位于任务请求者指定的任务地点/区域的参与者提交任务答案。然而,将空间众包任务外包给远程的空间众包服务器带来了新的安全隐患。传统的空间众包任务分配要求任务请求者和参与者将位置信息发送到服务器以完成距离判断和任务匹配,但是地理位置信息作为个人隐私,不应当被直接暴
为了实现“碳达峰”、“碳中和”的能源革命和环保诉求,锂硫电池是目前最有潜力的储能设想之一。但受限于正极硫物种穿梭效应、动力学缓慢等,其商业化应用进程一直停滞不前。针对以上科学问题,我们结合了碳材料和金属硫化物各自的优势,通过异质结策略和缺陷工程设计了两类富缺陷异质结硫宿主材料,以提高锂硫电池的电化学性能,并详细探究了异质结上的缺陷位与锂硫电池反应动力学的相互关联性。具体研究内容如下:(1)Co9S