多尺度局部结构主导二值模式学习图像表示

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:kamomoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像局部特征描述是计算机视觉的一个基本问题,局部特征描述子作为一种底层特征描述技术,可以描述丰富的图像局部细节结构,在图像发生形变、遮挡或缺损时,仍然表现出较强的鲁棒性,因此被广泛应用在目标检测和识别等计算机视觉任务中。计算机对图像进行理解通常采用“从局部到全局”的策略,这是一个从微观到介观到宏观,由底向上的图像描述过程。但是目前常用的图像特征抽取与描述技术是基于宏观整体或局部区域的,除LBP与GIMMRP算子外,很少有基于微观结构描述的局部特征技术。LBP具有计算简单,对图像旋转和图像灰度变换能保持不变性等优异性能,然而常规的LBP方法不足在于:(1)在二值化处理中,LBP仅保留了像素之间的灰度关系,导致图像细节信息的大量丢失;(2)LBP有可能会出现分布不均匀的直方图以及出现频率较低的模式类型;(3)LBP对所关注的模式类型需要预先定义,如“统一模式”是一种预先定义的模式。GIMMRP具有LBP相类似的优点,同时对图像微观结构有很强的描述表达能力,大幅度提升了二值描述算子的判别能力。但GIMMRP算法需要对图像中每一个3×3邻域和131个卷积模板进行卷积运算,导致计算效率低,运行速度慢,且获取到的BIMP重要模式是人为选择的结果,然而实际上对于不同的识别问题和应用数据集,其主导模式及其出现的频率并不一样,因此需要确定适应于每个数据集的最有效的主导模式集。本文通过零均值化的微观结构模式二值化(Zero-mean Microstructure Pattern Binarization,ZMPB)处理,提出一种立足于局部图像多尺度结构二值模式提取的图像表示方法。该方法能够表达图像中可能出现的各种具有视觉意义的重要模式结构,同时通过主导二值模式学习模型,可以获得适应于图像数据集的主导特征模式子集,在特征鲁棒性、鉴别力和表达能力上达到优异性能,同时有效降低特征编码的维度,提高算法的执行速度。为了验证算法的性能,在人脸图像数据集ORL和YALE,自行搜集的车标数据集和MNIST手写数字数据集上进行了实验,实验结果表明该算法性能优异,具有很强的判别能力和鲁棒性,优于传统LBP和GIMMRP方法,和很多最新算法结果相比,也具有一定的竞争优势。作为一种通用的图像识别描述方法,其具有高效、高鉴别力和较强的鲁棒性优点。可以广泛应用于目标检测、物体分类、文本检测与识别等领域。
其他文献
本文是一篇英译汉翻译实践报告。原文源自米娜·格雷戈里编著的《乌菲齐美术馆与皮蒂宫——绘画,画家及绘画流派》,这是一本关于欧洲绘画艺术的专业书籍。此类文本定会引起国内绘画艺术家或绘画艺术研究者的兴趣,将它翻译出来必能对中国画家或任何想了解欧洲画派以及西方绘画史感兴趣的人提供帮助。文本属于艺术类文本范畴,文中包含了许多专有名词、绘画领域的专门术语等,都为本文作者所不熟悉,这给作者完成翻译任务提出了不小
根据目前研究成果显示,我国人口老龄化情况比原有预想的形势更加严峻,任务也越加紧迫。有预测显示,至2050年我国将有4.83亿老年人口,超过此前国家人口发展战略预测5200万。也就表明,中国老龄人口占比度将上升至34.1%,高出预测4个百分点。自2009年起为积极应对老龄化,我国多次推出相关政策,明确了养老服务体系构建的基本原则,为居家养老服务提供支持政策,鼓励医养结合,倡导社会力量兴办医养结合机构
随着互联网的发展,软件在网络体系中的作用越来越重要,几乎所有的信息系统和商业应用都提供了基于软件的服务。例如电子商城、网络银行、快捷出行等领域都以Web网页或者移动APP等形式开展业务。这些软件形式的应用都是由大量的代码构建而成的,并且一般来说都有一个较长的开发周期,因此很有可能存在各种各样的安全漏洞。安全漏洞不仅会影响软件和服务器本身,还会对用户造成威胁,导致信息泄露、财产损失等后果。因此,如何
3D MIMO技术作为5G移动宽带通信系统的关键技术之一,越来越受到国内外专家以及学者的关注。干扰抑制技术可以有效地降低干扰,提高通信质量,是3D MIMO无线通信系统的核心技术之一。量子菌群算法结合了量子计算和群智能算法的思想,可以用来求解传统的基于拉格朗日算子的优化算法无法解决的组合非凸优化问题,且收敛速度较快。本文基于改进的量子菌群算法,分别研究了考虑用户公平性情形下的基站波束下倾角以及功率
口译中译员过多的自我修正会导致译语不流利,影响听众评价和沟通效率。本文对于二语习得和口译中自我修正现象及研究进行了一定的回顾,探讨了汉西交传中译员自我修正的产生原因和解决方法。本文作者以亲身参与的“2018年联合国世界旅游组织第22届全体大会”模拟会议为例,将案例中的自我修正现象分为有效修正(不同信息修正、恰当性修正、语言错误修正)和无效修正(无意义重复性修正和未完成修正)。研究发现,翻译过程中出
作为生命教育的核心内容,生命价值一直贯穿在高校生命教育过程的始末。但由于大学生正处于个性观念的成长期,受到自身认知不足以及外界各种环境的影响,使他们对生命、生命价值以及生命价值实现等相关问题的理解产生偏差。故对拥有现代科学文化素养以及“新时代”正义感和责任感的大学生进行生命价值问题的理论和实践研究,有利于大学生客观的认识自我;有利于充分挖掘和培养大学生生命价值实现的情感和能力;更有利于充分激发大学
随着我国宽带战略的实施部署以及骨干网络光纤化进程的加快,接入网技术的进步成为了促进有线宽带网络发展的关键因素。广泛铺设的有线同轴网络作为国家信息基础设施的重要组成部分,应当被充分利用,发挥其学术与经济价值。HINOC(High performance Network Over Coax)高性能同轴电缆宽带接入解决方案是针对我国有线同轴网络特性研发的具有完备自主知识产权的新型EOC(Ethernet
针对经典的基于证书的公钥密码算法当中,由于用户与其公钥之间存在的一一对应的特殊关系,用户需要存储大量的证书从而导致了比较复杂的证书管理问题。因此,对于新的基于身份的加密算法和无证书的加密算法的探索逐渐成为了国内外学者研究的热点。在经典加密方法之中,通常的方法是对一个消息进行先签名后加密,而签密则是将签名和加密合二为一。随着网络信息的规模日益庞大,同一信息需要多个用户共同签密并且发送给多个接收者的加
背景与目的:胃癌发生是一个多因素、多步骤、多基因参与的过程,在这一过程中,其基因调控网络是动态变化和条件特异性的。因此,研究胃癌发生过程中基因调控网络的动态变化,能
随着雷达遥感探测技术的不断发展,利用天气雷达定量估测降水得到愈来愈广泛的应用。由于雷达受系统复杂与外界干扰影响测量准确性低,且降雨的时空特性强,变化较快,目前通过雷达反射率因子(Z)和降雨强度(I)建立关系式Z=AIb进行估测降水的效果并不是很理想。本文围绕提高雷达定量估测降水精度进行研究,提高雷达探测资料质量,并利用人工神经网络(Artifical Neural Network,ANN)出色的非