稀疏深度学习理论与应用

来源 :西安电子科技大学 | 被引量 : 3次 | 上传用户:genersoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在诸多应用领域不断地取得着巨大的成功,其应用成果也直观地影响着人们对以深度学习为核心要素的人工智能有了更新的认知与理解,但这些应用成果背后的深度学习理论研究则举步维艰。当前,无论是工程应用还是理论分析,与稀疏深度学习相关的研究已经越来越多。特别是,随着稀疏特性融入网络的方式呈现多样性,稀疏深度学习这一有效的计算模式在实践应用中取得了显著的效果,但仍有许多的研究难点。从网络的架构,模型的优化以及模型的压缩等角度来看,稀疏深度学习的研究难点主要包括以下六个方面,一是沿用经典的栈式思维,由浅层可解释性模型以堆栈的方式构建的深度可解释性模型通常可满足较好的可解释性,但模型的可微性与稳定性较差,并且在一些复杂的视觉任务上,其泛化性能若要媲美深度可微分系统仍需要质的提升;二是稀疏深度学习仍采用误差反向传播为思想的梯度下降策略来优化更新网络的参数,虽然有一些优化技巧可以有效地缓解梯度消失问题,但本质上,设计避免局部极值和鞍点的高效优化算法仍是有待解决的难题;三是稀疏性虽然有助于深度网络的压缩,但如何利用稀疏深度学习来进一步探索过拟合缺失问题的本质,是目前研究的一个难点;四是在深度学习模型中嵌入稀疏性的方式种类繁多,虽然模型的稀疏化有诸多优势,但过度的稀疏性也常会导致模型的稳定性变差,进而导致网络的泛化性能降低,如何合理地在深度学习模型中引入稀疏性以解决网络模型的稳定性问题是当前研究的难点之一;五是如何利用稀疏深度学习中隐层输出的稀疏特征的特性(如衰减特性,谱特性等)来分析网络的泛化性能以及鲁棒性成为有待解决的难题;六是随着网络层级的加深,用于重构任务的有效信息不断地丢失或被遗弃,如何设计一个可用于分解与重构任务的稀疏深度学习框架是目前研究的一个难点。
  另外,众所周知,经典的深度可微分系统依赖基于误差反向传播的梯度下降算法获得了巨大的成功,无论是从泛化性能,还是模型的稳定性上,都较传统的机器学习模型有了质的飞跃。目前,深度可微分系统仍不能系统地对模型的可解释性作出合理性的回答。在这样的背景下,本文针对上述的部分难点问题做了较为系统性的理论研究与分析,更为具体的理论与应用性创新性贡献分别如下:
  1.针对网络的架构以及模型的优化,提出了一种快速稀疏深度神经网络,旨在为深度神经网络的学习与优化提供一种可替代的训练方法。该网络模型的设计包括以下两个方面:一是利用凸优化下对应的闭形式解给出每一隐层下的参数优化学习,这与采用迭代更新策略的误差反向传播算法不同;另一个方面是利用多层线性求和的方法来逼近输出目标,这与现有的深度神经网络不同。特别是,提出的快速稀疏深度神经网络无需精调即可获得良好的泛化性能。
  2.针对小样本学习任务,提出了一种稀疏深度组合神经网络。其优势在于层级优化机制能够独立地通过解决凸优化问题来实现对每个隐藏层的参数学习。该网络框架可分为三个部分:一是使用基于InfoGAN的组合机制生成样本;二是采用数据学习来解决样本的复杂性;三是采用稀疏深度组合神经网络对多路径层进行快速高效的计算。另外,该网络的设计基于极限学习机的思想,对它的改进也是本章研究的一部分。实验已证实:基于InfoGAN的样本组合机制,生成样本的质量随着组合数的增加趋向越来越好。
  3.与经典的无监督逐层学习方式不同,我们考虑到了利用逐层有监督的方式来逐层预训练,提出了稀疏深度堆栈网络框架。该框架包括稀疏深度栈式极限学习机和稀疏深度张量极限学习机。对于稀疏深度栈式极限学习机,网络的设计沿两个部分展开:一是受极限学习机的启发,设计了一种稀疏单隐层多通路极限学习机,其优势可以在隐藏节点数相对少的情况下,以较快的速度实现较高的泛化性能;二是将稀疏单隐层多通路极限学习机以堆栈的方式形成稀疏深度栈式极限学习机。对于稀疏深度张量极限学习机,通过张量运算可有效地减少隐层参数的个数,进一步帮助网络完成较高的泛化性能。
  4.为了充分利用类别先验信息来改善深度网络中每一个隐层上特征的判别能力,提出了一种稀疏深度判别神经网络模型,其目的是形成逐层逐类更为紧致的特征表示。具体来说,我们分别利用字典对学习和稀疏表示分类器来提升稀疏深度神经网络中各隐层的判别能力,其中隐层特征的判别能力体现在类内一致性与类间的差异性上。与现有的深度堆栈自编码网络和深度置信网络相比,所提出的网络具有更快的算法运行速度以及收敛特性,隐层的判别能力促使稀疏深度网络的泛化性能在多种分类任务中更具较强的竞争力。
  5.为了设计一个用于分解与重构机制下的稀疏深度学习模型,我们提出了稀疏深度差分神经网络。相比经典的深度学习系统,层级抽象特性是具有某种相关性的,从整体上难以认识并对深度学习的网络作出合理的可解释分析。而我们提出的稀疏深度差分网络框架首次引入差分特征的概念,以替代通常将抽象特征作为输入的有效表达这一经典的特征学习模式,通过逐模块差分学习,使得网络整体或端到端上的可解释性分析演变为更为容易的局部化分析。并且这一设计方式可方便的延拓至经典的深度学习系统中,与传统线性分解重构的Mallat算法不同,层级差分特征这一概念的引入为深度学习系统提供了一种非线性分解重构的思路,并给出了输入另一种有效的表达方式。
其他文献
听,  春的声音,  小鸟在枝头,  “叽叽喳喳”,  是鸟儿和小朋友问好的欢歌。  听,  夏的声音,  雷云晃晃身子,  “哗哗啦啦”,  是夏雨送给大地的旋律。  听,  秋的声音,  麦穗挺拔在田野,  “呼~呼~”,  是麦浪献给农民伯伯的序曲。  听,  冬的声音,  雪花离开了妈妈的怀抱,  “簌~簌~”,  這是白雪送给山水的欢愉。  祖国妈妈的春夏秋冬,  如此动听,  这般美妙
期刊
最近,我的一位心高气傲、不可一世的闺蜜整日抱怨连连,对她老公所有的“控诉”,最终都被归结为:老公已不再爱她,婚姻也失去意义。有多少女孩儿在年少时,都梦想着找一匹“白马”,做一辈子公主,就一直任性下去,永远都不要长大。但现实毕竟是现实,这个梦迟早要醒来,只不过,每个人醒来的时间不同而已。  如果人生道  路上早早地遇到几位不怎么样的前男友,这些“导师”会让你很快醒来,知道自己真正想要的是什么,才会找
期刊
我生在两千年前,  给多少代人带来欢乐!  猜猜我是谁吧!  我用一张张皮,  做出千万生灵:  文旦武旦,  老生小鬼,  甚至是二郎神和李天王!  猜猜我是谁吧!  我用一块大幕,  变成大千世界:  西厢恩怨,  牛女相望,  甚至是师徒四个把妖降!  猜猜我是谁吧!  我凭精致多样,  博得大家喜愛:  大展白幕,  看客满堂,  甚至是乘风破浪去远航!  大家都来猜一猜:  我是谁?
期刊
【相亲】  秋天是柚子和丰收相亲的季节,  风吹开了一望无际的绿,  让金柚子羞红了脸,  无处可藏的它,  只好和丰收见了面。  【打包】  渔船太大了,  满仓的鱼虾,  满仓地跳,  大人们在高高的船头把丰收打包,  我在沙滩上把秋天打包,  大海、云朵和开学的新书包。  【签单吧】  我猜,  大雁的职业是快递小哥,  天天奔忙在天上,  一會儿排成个一字,  一会儿排成个人字,  他们说
期刊
干燥的秋风把身体水分、油分都带走的同时,留下的只有干纹和粗糙。一款润滑且毫无油腻感的护肤油,是此刻润泽肌肤的天然“好油物”。
期刊
春天来了,我要把春天装进瓶子里,  倒满茶水,就是一杯香气四溢的花茶了。  夏天来了,我要把夏天装进瓶子里,  加满冰水,就是一杯清爽解渴的柠檬水了。  秋天来了,我要把秋天装进瓶子里,  灌满汽水,就是一杯水果苏打水了。  冬天来了,我要把冬天装进瓶子里,  加满牛奶,就是一杯热巧克力牛奶了。  云朵飄过,我要把云朵装进瓶子里,  倒满草莓奶昔,就是草莓奶盖了。  看到大海,我要把大海装进瓶子里
期刊
临近海珠区繁华地段江南西的南边,有一所名声在外的学校。以校训命名的力学楼、和美楼、律己楼、求进楼静静矗立在校园内。今年9月,海珠区实验小学迎来校园升级后的第一个学期,这所拥有30余年历史的海珠老校以崭新的面貌哺育着每一位“守规则、有担当、会学习、爱生活、勇创新”的新时代少年。  服务未来  四维教育引领孩子全面发展  走进海珠区实验小学,十八个字的教育理念映入眼帘。1988年,海珠区实验小学的前身
期刊
膏状眼部产品有着其他眼妆产品与众不同的特点;既能用手打造眼妆,也能临时充当眼线,更可以干湿混合使用,不愧为眼妆产品中的“膏”手。
期刊
涂抹了浓郁唇膏的双唇,是女人散发性感魅力的秘密武器;而卸妆后的唇部,则很可能是泄露年龄的“告密者”。“素颜”后的唇部更需要细致温柔的呵护。
期刊
黑色过于肃穆?金属色过于冷冰?也不喜欢过于浓郁的哑光色?那么尝试一下带细微光泽感的美妆单品吧!虽然闪烁但绝不嚣张,虽然柔和但依旧个性十足。
期刊