论文部分内容阅读
图像的分类与识别在人机交互、视频监控、多媒体检索等方面有着广泛的应用前景。传统的计算机模式识别方法不能取得令人满意的效果,人类本身却可以轻松的完成物体识别和理解的任务。本文借助人类认知理论的研究成果,以认知科学中的特征捆绑思想为基础,进行图像的分类与识别。本文主要进行了以下3方面逐步深入的研究:
1.提出了组合条件随机场进行多标签图像分类。针对传统的多标签分类方法容易丢失标签间的语义关联的问题,使用了条件随机场整体建模图像语义。利用Bag-of-feature方法将图像语义近似的转化为一维序列,然后使用二阶条件随机场捆绑图像的底层语义特征和高层知识,识别图像内容,并通过对多个初始特征不同的条件随机场推理结果的组合学习来提高图像内容识别的准确率。实验证明,本方法有效关联了标签语义,取得了更好的多标签分类效果。
2.构建特征捆绑的计算模型进行多标签图像的分类与识别。为了更准确建模图像的二维语义,本文借助随机场的基本原理形式化了特征整合理论,建立了“捆绑”过程的数学模型。通过使用多范围图像特征,将图像的局部特征和区域、整体特征关联起来。使用二维结构的关联函数和交互函数定义了关系编码模式,以更准确表征图像的二维语义。借助最大熵原理得到关系编码模式的最佳分布,通过学习过程获得识别网络。该模型融合了自底向上和自顶向下过程来完成特征捆绑,在图像分类和识别方面取得了很好的效果。借助认知理论构建特征捆绑模型的研究方法对基于统计的模式识别方法具有启发意义。本模型对认知科学研究也很有意义,一是佐证了特征整合理论,二是基于最大熵原理的学习过程对认知研究也有一定的启示。
3.提出选择性注意随机场解决图像底层特征扭斜的问题。本文针对特征捆绑过程中存在底层特征数据的扭斜会影响识别效果这个问题,提出了自底向上的选择性注意算法。对底层特征相近的图像小方格进行重构,采用结构相似度指标评价重构图像的质量。采用贪心策略和二分搜索思想在对数次图像重建过程中获得抑制基团,有效筛选了图像特征。并根据抑制基团来定义注意函数,并将其融入条件随机场。选择性注意有效减少了图像底层特征,降低了随机场的特征函数数量,从而提高了学习效率。同时,特征数据的扭斜被减弱,提升了条件随机场的学习效果。总之,选择性注意随机场使物体识别效果和运算效率都得到进一步提高。