生物启发式视觉识别模型与算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：hudawen

【摘要】

：

视觉主导着人类的知觉系统，是一切行动的重要基础。长期以来，研究者试图赋予人工系统类人的视觉处理能力。视觉识别，特别是图片分类和物体检测一直是研究的重点，是更高级别视觉感

【作者】

：

李寅霖

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2016年期

【关键词】

：

视觉识别生物学实验图片识别多层聚类法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视觉主导着人类的知觉系统，是一切行动的重要基础。长期以来，研究者试图赋予人工系统类人的视觉处理能力。视觉识别，特别是图片分类和物体检测一直是研究的重点，是更高级别视觉感知和认知的基础，在多个领域具有不可替代的重要作用。在过去几十年里，视觉识别算法取得了一系列标志性成果。但与人类视觉认知能力相比，视觉识别算法在稳定性、泛化性等方面还存在较大差距。而在认知神经科学等领域，随着新的实验和分析技术的进步，研究者在宏观和微观层面对生物视觉系统提出了新的发现和解释。　　因此，对视皮层的结构、机理和功能进行模拟，设计生物启发式视觉模型和算法，将为现有视觉算法中存在的问题提供可能的解决方案，为视觉任务建模提供新方法和新思路。同时，为生物学实验数据和结论提供可计算验证平台，并启发新实验设计。近几年来，生物启发式视觉模型与算法研究成为生物与信息交叉学科的一个重要研究方向。以此为出发点，本文针对生物启发式视觉识别模型和算法，从模型框架设计、学习算法设计和模型解释三个方面开展研究，主要工作和贡献如下:　　(1)将联想和记忆初步引入到腹侧视觉通路多层认知模型(Hierarchical Maxpooling Model，HMAX)中，建立了一个视觉认知的基础框架。其中，物体的记忆包括语义记忆和情景记忆，显著的语义特征可调节情景特征部件的记忆。同一类特征的学习和记忆发生在相同脑区，分布式的特征表达可服务于同类特征的快速联想。通过识别记忆的两个阶段，即相似判别和回忆匹配来实现识别，也可通过多个特征部件语义特征和情景特征的集群编码实现识别。相比于HMAX模型，新模型对物体识别任务可输出语义描述，具有更高的识别准确率，并对相关机制的建模提供了一个基础框架。　　(2)针对视觉认知前100-150毫秒的前馈过程，将注意力调节、记忆加工和位置编码引入HMAX模型。在新模型中，模拟初级视皮层(V1)自下而上的注意力机制，基于多种特征的对比差异形成显著图，为特征选择提供初始候选区域。模拟颞叶皮质(IT)分布式的特征学习和聚集机制，对初始采样的多尺度中间级特征模板迭代聚类，学习具有判别性和表示能力的特征模板，实现相同/相似特征模板的聚类和共享，充实工作(1)中分布式的特征学习和记忆方式。最终，对特征和位置组合编码，实现多类物体分类任务。相比于HMAX模型和其它基于字典学习的方法，改进模型具有更高的分类准确率。　　(3)改进卷积深度置信网络(Convolutional Deep Belief Network，CDBN)，对其特征学习过程进行可视化分析，设计更简洁的结构实现更准确的判别。通过对卷积核和特征图的可视化，验证和分析CDBN模型的特征学习能力，及其与HMAX模型和视皮层在功能上的对应关系。对高层特征图的响应，通过同一样本最大整合和不同样本平均整合的方式，实现关键部件空间位置学习，为特征部件更加精细的特征和语义学习提供可能的位置范围。进一步，对重构的卷积核进行聚类分析，选择代表性的卷积核对模型进行简化。与HMAX模型和其它基于字典学习的模型比较，改进模型具有更高的分类准确率。最后，提出了使用“记忆权重”或“记忆样本”的方式实现在线增量学习，使网络具有对新旧类别样本的适应能力。本工作对了解多层网络的特征学习过程，有效利用中间层输出，简化网络结构并实现网络自适应具有重要意义。　　(4)将卷积神经网络(Convolutional Neural Network，CNN)，主要包括快速的基于区域的CNN模型及其它相关算法应用到头戴式摄像机采集的多类抓取手势图片识别中。与基于多种人工设计特征和多阶段处理的算法不同，本方法可以自动学习判别性特征，在复杂背景下，同时实现多种抓取手势的分类和定位。进一步，使用一种多层聚类方法，建立多类抓取手势的树形结构，并分析各个抓取手势之间的相关性。本工作中快速准确的抓取手势分类、检测和基于多层聚类的抓取分析为安全自然的人机交互、机器人操作的自学习、灵巧智能手的设计与控制提供了重要支持。　　本文提出的模型和算法为相关视皮层结构和机制的精细计算建模提供了基础框架和功能模块，对高性能视觉认知模型和算法的设计和实现提供了新思路，在理论和应用中都具有重要的研究意义。

其他文献

Watts-Strogatz网络中的传播行为

本文以复杂网络作为研究对象，在介绍了复杂网络研究背景、研究现状等基础上重点分析了一种小世界网络—WS网络中的病毒传播行为。首先我们分析了病毒传播过程中采用同构混

学位

小世界网络WS模型病毒传播临界极限

约束条件下遗传算法的结构分析及设计方法研究

本文应用自适应数学模型，借鉴生物界种群与其生存环境相互作用，互相依托，共同进化发展的原理，提出了小生境—环境协同进化遗传算法(EITGA)。把问题区间划分为若干个小区间，每一个

学位

遗传算法遗传规划收敛性

基于LON网络的智能小区家庭控制系统

本文在阐述了智能小区的概念、组成以及中国智能小区发展现状的基础上,分析了智能控制网络技术——LonWorks技术的主要特点,提出了一种基于LON网络的智能小区家庭控制系统的

学位

智能小区LON网络LNS单总线

现场总线下的先进控制

先进控制是工业界挖潜增效的主要手段，如何在DCS中发挥出先进控制的最佳性能，如何在新兴的FCS中进行先进控制，这些都是当前需要研究探讨的问题。本文以精馏过程和实验室加热炉温

学位

预测控制控制结构现场总线精馏过程实验室加热炉

社交媒体内容流行度的建模与预测方法研究

近年来，随着互联网的迅猛发展和普及，社交媒体已经成为人们获取信息、表达思想以及分享观点和情感的重要平台。社交媒体中用户间的交互行为使得某些用户生成的内容（如讨论帖、微

学位

社交媒体交互行为流行度建模预测方法

基于uClinux的嵌入式系统的应用

嵌入式系统是将先进的计算机技术、半导体技术和电子技术与各行各业的具体应用相结合后的产物。嵌入式系统已经成为当前IT产业的焦点之一，但同时大量的嵌入式应用也对嵌入式系

学位

嵌入式系统uClinux系统文件系统YAFFS系统税控收款机uCOS系统LCD驱动程序

电力电子技术CAI及仿真软件的研究和开发

电力电子技术CAI及仿真软件对于《电力电子技术》课程的学习和现代多媒体教学具有十分重要的作用。本课题对该软件进行了较为深入的研究开发，完成了一套完整实用的电力电子技

学位

电力电子技术CAI计算机辅助测试计算机仿真频谱分析数据库技术多媒体教学

基于计算实验的区域路网交通信号控制研究

交通运输是国民经济的命脉，直接影响社会经济、生产与生活的各个方面，与每个人的生活休戚相关。随着城市化进程的不断推进，城市规模不断增大，城市人口越来越多，而分配给交通系统的

学位

计算实验交通信号控制区域路网动态规划交通系统交叉路口

三维重建中的算法研究

摄像机标定是三维重建中的基本问题。自标定方法的灵活性使得它是摄像机标定中的重要研究方向。其中，基于分层重建方法和基于绝对对偶二次曲面方法是较为成熟和广泛应用的自标

学位

三维重建摄像机自标定算法直线三角化算法鲁棒算法

风险投资系统演化理论研究

本文根据系统科学中有关系统演化的理论描述，充分借鉴和运用系统概念、大系统分解方法、反馈控制思想和动态演化思想，分析风险投资行业从诞生伊始演化为成熟状态的整个过程所遵

学位

风险投资系统风险投资系统演化理论演化理论系统维生能力系统维生能力维生机制维生机制

生物启发式视觉识别模型与算法研究

其他学术论文