基于特征捆绑的图像分类与识别研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:elong_ctu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的分类与识别在人机交互、视频监控、多媒体检索等方面有着广泛的应用前景。传统的计算机模式识别方法不能取得令人满意的效果,人类本身却可以轻松的完成物体识别和理解的任务。本文借助人类认知理论的研究成果,以认知科学中的特征捆绑思想为基础,进行图像的分类与识别。本文主要进行了以下3方面逐步深入的研究:   1.提出了组合条件随机场进行多标签图像分类。针对传统的多标签分类方法容易丢失标签间的语义关联的问题,使用了条件随机场整体建模图像语义。利用Bag-of-feature方法将图像语义近似的转化为一维序列,然后使用二阶条件随机场捆绑图像的底层语义特征和高层知识,识别图像内容,并通过对多个初始特征不同的条件随机场推理结果的组合学习来提高图像内容识别的准确率。实验证明,本方法有效关联了标签语义,取得了更好的多标签分类效果。   2.构建特征捆绑的计算模型进行多标签图像的分类与识别。为了更准确建模图像的二维语义,本文借助随机场的基本原理形式化了特征整合理论,建立了“捆绑”过程的数学模型。通过使用多范围图像特征,将图像的局部特征和区域、整体特征关联起来。使用二维结构的关联函数和交互函数定义了关系编码模式,以更准确表征图像的二维语义。借助最大熵原理得到关系编码模式的最佳分布,通过学习过程获得识别网络。该模型融合了自底向上和自顶向下过程来完成特征捆绑,在图像分类和识别方面取得了很好的效果。借助认知理论构建特征捆绑模型的研究方法对基于统计的模式识别方法具有启发意义。本模型对认知科学研究也很有意义,一是佐证了特征整合理论,二是基于最大熵原理的学习过程对认知研究也有一定的启示。   3.提出选择性注意随机场解决图像底层特征扭斜的问题。本文针对特征捆绑过程中存在底层特征数据的扭斜会影响识别效果这个问题,提出了自底向上的选择性注意算法。对底层特征相近的图像小方格进行重构,采用结构相似度指标评价重构图像的质量。采用贪心策略和二分搜索思想在对数次图像重建过程中获得抑制基团,有效筛选了图像特征。并根据抑制基团来定义注意函数,并将其融入条件随机场。选择性注意有效减少了图像底层特征,降低了随机场的特征函数数量,从而提高了学习效率。同时,特征数据的扭斜被减弱,提升了条件随机场的学习效果。总之,选择性注意随机场使物体识别效果和运算效率都得到进一步提高。
其他文献
互联网、多媒体技术以及对视频的大量研究推动着视频压缩技术的不断发展。由于网络带宽的限制,视频信息的实时传输要求有高效视频压缩编码技术作为基础。运动估计技术可以有
由于工区中采集的井点数据比较少,应用一些常规插值方法,如反距离加权法,插值效果不理想。本文采用普通克里金估计技术进行插值,取得较好效果。普通克里金只使用了井点数据,而工区
人脸识别技术作为一种被广泛接受的生物特征识别技术,具有重要的理论价值和广阔的应用前景。经过几十年的发展,人脸识别技术取得了长足的进展。大量的性能评测与学术研究表明,在
地球上的水处于不断地循环之中,水在不同阶段的循环过程便构成了大气水循环。土壤蒸发是大气水循环中十分重要的一个环节,它涉及到土壤水运动(如入渗、壤中流等)、能量平衡、
物联网是一种可以将任何商品与互联网连接起来,按约定的协议进行信息交换,实现智能化识别、定位、跟踪、监控和管理的一种网络。物联网中的信息流通能够通过对商品的唯一标识
随着现代社会的信息化,身份识别及验证已经引起了广泛的研究热潮。一个人的身份识别及验证包括多种手段,例如指纹识别,瞳孔识别,印章识别及本文的研究方向签名识别。其中,签
三维数据场的体绘制技术是科学计算可视化的重要内容。将三维数据场的体绘制技术应用于地震数据体的三维绘制,能够直接揭示蕴含在庞大数据中的地质现象与规律,帮助科研工作者详
基于内容的音乐信息检索(Content-based Music Information Retrieval,CBMIR)逐渐成为语音处理、信息检索、模式识别领域研究的焦点。在基于内容的音乐检索技术的相关研究中,
近年来,随着半导体技术的发展和信息技术以及数字化产品的普及,Internet被广泛地应用;与此同时嵌入式技术也取得突飞猛进的发展,并以其低成本、低功耗、小体积、高稳定性和可
本体被用来描述某领域的概念以及概念间的关系,一般由概念,概念间关系和公理三部分组成。概念本体则专指本体中的概念部分,构建概念本体是教学资源建设的基础。目前的概念本