深度卷积神经网络中基于序的池化方法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:ty_142857
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深度卷积神经网络(Convolutional Neural Networks,CNNs)中,池化是一个关键机制,有利于CNNs获得具有平移不变性的特征。大量的经验和理论研究表明,池化能够有效的提升CNNs的性能。传统的池化操作一般是基于激活值的。本文提出一种基于序的池化机制。提出这种池化方法的动机是,在池化域内,激活值的序只与激活值的大小关系有关,而与其实际大小无关。基于激活值的序计算池化输出有利于获得更加鲁棒的特征。此外,通过合理的使用激活值的序能够有效地避免基于值的方法所面临的数据尺度问题。基于序的池化方法可以视为一种加权池化,也就是将池化域内所有激活值的加权和作为池化输出。根据加权方式的不同,本文提出三种新的池化操作:基于序的平均池化、基于序的加权池化和基于序的随机池化。作为另外一个重要贡献,本文引入判别熵的概念,提出一种评估池化方法判别能力的准则。在图像识别和人群计数两个计算机视觉任务上评价提出的方法。在图像识别任务上,四个标准数据集(MNIST、CIFAR-10、CIFAR-100和NORB)上的实验结果表明,提出的基于序的池化方法相比于已有方法有更好的识别表现。为了进一步展示提出方法的优越性,将基于序的随机池化方法与NIN(Network-inNetwork)网络结合,在CIFAR-10和CIFAR-100数据集上获得了更加优异的识别效果。在人群计数任务上,针对摄像机透视效果、图像背景、人群密度分布不均匀和行人遮挡等问题,提出一种基于序的空间金字塔池化网络的人群计数方法。该方法将原图像分成多个具有相同透视范围的子区域并在各个子区域分别取不同尺度的子图像块,采用基于序的空间金字塔池化网络估计子图像块人数,然后相加所有子图像块人数得出原图像人数。提出的图像分块方法有效地消除了摄像机透视效果和人群密度分布不均匀对计数的影响。提出的基于序的空间金字塔池化不仅能够处理多种尺度的子图像块,而且解决了传统池化方法易损失大量重要信息和易过拟合的问题。在UCSD标准数据集上的实验结果表明,本文方法相比于传统方法具有准确率高和鲁棒性好的优点。
其他文献
现实生活和生产中普遍存在着随机因素,由于受到随机因素的影响,使得对问题的求解造成不便。目前对随机条件下的寻优问题,主要从期望值角度、机会测度角度及其他的角度出发,应
物流信息产业是波及范围最广的产业之一,通常由原料供应商、企业客户、生产商、批发商、零售商等多个组织结构所构成,从而形成一条供应链。供应链中的企业间是相互联系、相互
随着信息社会的快速发展,web数据已经发展成为一种巨大的信息资源。Web信息抽取作为一种从web数据中抽取主题信息的研究内容,是数据分类、自然语言处理等研究领域的基础。因
伴随着信息社会和定位技术的快速发展,基于位置的服务已经成为生活中不可缺少的一部分,并使人们生活变得更加便捷。与此同时,人们也将面临着轨迹隐私泄露的问题。由于人们对
信息技术的快速发展,互联网用户量和信息量规模的不断扩大,网络空间的信息生产者由传统媒体逐步趋向大众化和平台化。随着个人影响力的提升和人工智能的普及发展,人人都是信
随着互联网、WEB2.0和电子商务的发展,在微博、贴吧和网站的评论中出现了大量的人们对商品、服务、新闻等领域发表心得、体会和意见的评论信息。准确地分析出用户的评论信息
随着计算机网络应用的推广及网络用户数量的增加,系统资源利用率和响应时间对数据库优化提出了挑战,传统手动调度的优化方式已经无法满足实际应用的需求,数据库动态优化技术
Web服务是可配置的软件服务,它采用开放的标准及协议连接集成分布式组件,创建和管理计算机应用。因其具有高度的互操作性、跨平台性和松散耦合等主要特征,Web服务已成为分布
随着宽带无线通信的迅速发展,高速、高质量和多媒体成为移动通信的新的需求。集政府、铁路、航空和应急等部门为用户主体的,具有团队指挥调度功能的无线宽带集群通信日益受到
制作交通事故现场图是交通事故处理的重要环节。本课题拟研制基于硬件手绘板的交通事故现场手绘图的识别与归整制作系统,它能读取用户在硬件手绘板上的手绘图数据,识别理解其