基于非负编码和SPNs结构学习的图像分类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：qwer32173

【摘要】

：

图像分类问题在计算机视觉领域占有重要地位,其实际应用也非常广泛。探究有效的图像分类算法是近些年的研究热点,主要包括图像特征编码与深度结构学习两个方向。针对这两个方

【作者】

：

刘培娜

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2015年期

【关键词】

：

图像分类局部约束线性编码非负约束 Sum-Product Networks 变量独立

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像分类问题在计算机视觉领域占有重要地位,其实际应用也非常广泛。探究有效的图像分类算法是近些年的研究热点,主要包括图像特征编码与深度结构学习两个方向。针对这两个方向的研究热点与难点,本文的研究课题从两部分内容展开,一是基于特征编码的图像分类算法研究,二是基于Sum-Product Networks(SPNs)结构学习的图像分类算法研究。其中,特征编码的研究较为广泛,且取得了不错的成果,本文在局部约束线性编码(Locality-constrained linear coding,LLC)的基础上探究了更加有效的编码方式,并在常用图像数据集上进行图像分类来验证其有效性。而SPNs是刚提出的一种新型深度结构,本文基于SPNs的结构学习算法,探究了其特性及改进方法,然后在常用数据集上验证其分类性能的好坏。基于特征提取的图像分类算法的核心问题是如何对特征进行有效编码。局部约束线性编码LLC因其良好的特征重构性与局部平滑稀疏性,已取得了很好的分类性能。然而,LLC编码的分类性能对编码过程中的近邻数k的大小比较敏感,随着k的增大,编码中的某些负值元素与正值元素的差值绝对值也可能增大,这使得LLC越来越不稳定。本文通过在LLC优化模型的目标方程中引入非负约束,提出了一种新型编码方式,称为非负局部约束线性编码(Non-negative locality-constrained linear coding,NNLLC)。该模型一般采取迭代优化算法进行求解,但其计算复杂度较大。因此,本文提出两种近似非负编码算法,其编码速度与LLC一样快速。实验结果表明,在多个广泛使用的图像数据集上,相比于LLC,NNLLC编码方式不仅在分类精确率上提高了近1%~4%,而且对k的选取具有更强的鲁棒性。SPNs结构学习算法——Learn SPN的提出使得SPNs的学习更加快速灵活,但该学习系统只在离散二值变量生成的实例集上适用,且在常用于深度学习的图像数据集上,分类效果很不理想。为了扩展该算法在图像数据集上的适用性,本文对Learn SPN算法进行改进,生成新的NLearn SPN算法。该算法将其中的核心结构,即变量划分与实例划分使用新的算法实现,并对整个算法的流程进行了细微调整。在CIFAR-10数据集上的实验结果表明,改进后的NLearn SPN算法的分类效果也不太理想,可能是因为该算法中变量与实例的划分结构是人为设定而非自动学习到的,导致学到的SPNs对图像数据的表达偏差较大。若对NLearn SPN算法进行改进,使其自动学习SPNs的结构,在图像分类问题上也许能够提升其分类性能。

其他文献

基于贝叶斯网络和互信息的用户模型与个性化检索

随着网络应用的普及,网上信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用的信息,而是如何找到自己需要的信息。传统的通用信息检索技术满足了人们的一

学位

个性化服务贝叶斯网络互信息用户模型信息检索

基于FIPA ACL的语义Web服务通信协议的研究

语义Web服务是用本体来描述的Web服务,它的目标是使得计算机系统可以理解并解释Web服务的内容,满足智能Agent对万维网上Web服务的自动发现,调用和复合。Web服务采用SOAP(Simp

学位

FIPA ACL语义Web服务语义协议语义Web本体通信协议本体

基于数字水印的图像认证技术

随着多媒体技术和计算机网络的迅速发展,越来越多的数字信息产品通过网络广泛传播。在给人们带来便利的同时,由此而引发的非法拷贝和恶意篡改等侵权行为也引起了人们的关注。

学位

数字水印图像认证DCTJPEG压缩

基于概念格的本体模型及其相关运算研究

形式概念分析自1982年由德国的Wille教授提出以后,近年来被广泛用于软件工程、知识发现、信息检索等领域。形式概念分析中的核心数据结构——概念格通过Hasse图来表现出概念

学位

形式概念分析本体构建本体映射本体合并

基于特征融合和神经网络的掌纹识别方法研究

当今社会,随着信息化与网络化的高度发展,信息安全显示出前所未有的重要性。因此,作为其中一个分支的身份识别技术也就具有相当高的研究价值与广泛的应用前景。其中,生物特征

学位

掌纹识别K均值小波变换Zernike矩独立分量分析BP神经网络

面向非平衡混合型数据的分类算法及应用研究

非平衡混合数据分类处理在现实应用中非常普遍,该数据具有分布不均匀,属性多样等特性。传统的分类学习方法在处理该类型数据时有效性不高,而且在少数类样本足够重要时,甚至会

学位

计数最近邻分类算法非平衡数据全局密度k-局部密度边界点检测

人脸表情识别的研究及在游戏中应用的探讨

情感计算是国际上近几年刚刚兴起的、试图使计算机(机器)能够像人类那样具有理解和表达情感能力的一个多学科交叉的新研究领域,在智能人机交互中起着重要作用。由于人的情感

学位

灰度共生矩阵混沌遗传优化算法支持向量机游戏式学习

基于多源数据的视频语义分析与推荐技术研究

随着互联网的快速发展，网络上出现了越来越多的视频。在科学研究以及商业领域对视频信息的需求也愈发强烈，对于普通用户而言，能快速准确地从海量的视频库中找出感兴趣的视频并不

学位

视频语义分析推荐技术3D卷积神经网络连续时序分类

基于XML描述的信息家电远程监控系统的研究和设计

智能家居的目标是利用现代的通讯、网络、微电子、嵌入式等技术来提高人们的生活质量,使家庭变得更舒适、安全和有效。信息家电,是未来家用电器的主要发展方向。信息家电的发

学位

信息家电XML接口定义语言家庭网关B/S模式

基于内容的图像检索中多特征融合技术的应用研究

本文针对目前基于内容的图像检索算法在算法效率和准确性方面存在的局限性,探讨了基于内容的图像检索技术中若干重要问题,提出了一种应用于基于内容的图像检索系统的多特征融

学位

多特征融合EM算法半全局特征模糊特征匹配

基于非负编码和SPNs结构学习的图像分类算法研究

其他学术论文