论文部分内容阅读
在当前科技大环境下,互联网技术几乎已经普及到人类社会的所有领域,数字图像作为互联网中信息的重要传播媒介呈现爆炸式增长态势。海量的数字图像信息在为人们的生活和工作带来便利的同时,也为从事数字图像处理技术的研究者们带来了新的挑战。高速膨胀的图像数据已经远超机器的极限处理能力。需要寻求一种能够有选择的对图像数据进行处理的方式,把有限的计算资源用于关键数据的处理。研究发现,人类视觉感知系统具有从复杂场景中选择性的关注重要信息的能力,这种视觉选择性被称为视觉注意机制,被选择的信息称为视觉显著性信息。机器视觉领域的研究者们认为,模仿人的视觉注意机制能够提高机器对海量复杂信息的处理能力。据此,基于数字图像的显著性检测研究得以萌芽和发展。目前显著性检测研究已经成为机器视觉领域的一个重要研究方向。本文从图像显著性检测研究中存在的问题出发,提出了一些新的图像显著性检测算法。 本研究主要内容包括:⑴提出了分层显著性的概念以及对应的基于分层显著性的目标检测框架。针对单目标图像进行显著性检测,采用分层显著性对目标及其内部信息进行不同程度的显著性描述,以期其显著性检测结果能够满足更多的应用。所提算法首先采用不同尺度的超像素分割方法把图像分为粗粒度层和细粒度层,然后分别对其进行显著性检测。在粗粒度层,采用新的自适应算法构建超像素分割对应的图模型,并利用位移凸策略得到先验约束;结合先验信息和流形排序算法对图模型中的节点进行排序,排序结果对应的归一化图像即为粗粒度层显著图。在细粒度层,以粗粒度层显著图为先验,根据节点的对比度筛选出低对比度节点作为基对图像进行稀疏重建,其重建误差的归一化图像即为细粒度层显著图。最后,采用一种新的限制性投票算法融合粗粒度层显著图和细粒度层显著图为最终的分层显著图。相对于传统显著图,分层显著图能够直接应用于更多的计算机视觉任务中。与当前的领先算法的对比实验表明,所提算法能够取得较好的实验结果。⑵提出了一个基于动态视频的联合显著性检测算法。算法中,对视频中的动态和静态目标分别进行检测,采用联合显著性对它们进行差异化显著性标记。所提算法首先对视频中的单帧图像进行静态显著图检测。过程主要分为三步:第一步,采用似物性区域检测算法提取图像中的似物性候选区域;第二步,采用视觉注视点检测算法在单帧图像中提取视觉注视点显著图;第三步,组合似物性候选区域和视觉注视点显著图得到静态显著图。然后,所提算法对视频中的序列图像进行动态显著图检测。过程分为两步:第一步,采用改进的基于低秩的运动区域检测方法提取视频中的运动目标区域;第二步,结合运动目标区域和视觉注视点显著图得到动态显著图。最后,采用提出的融合算法把静态显著图和动态显著图融合为联合显著图。实验表明,相对于与当前的领先算法,所提算法能够取得较好的实验结果。⑶提出了一种的基于多任务深度神经网络模型的显著性目标检测算法。算法针对显著性目标检测的准确性和完整性问题,采用基于多任务深度神经网络模型对图像的全局性和目标的完整性进行约束。所提算法分为学习过程和检测过程。在学习过程中,首先,构建输入样本的不同层次的上下文图像。然后,采用一个多层的全卷积网络作为多任务的共享网络结构来提取图像特征。最后,通过目标轮廓提取任务输出图像目标轮廓图,通过显著性检测任务输出图像显著图。根据对应的基准图像,分别构建对应的损失函数。两个任务交替执行,共同完成模型的参数优化过程。在检测过程中,输入图像首先通过显著性检测任务得到图像显著图,通过超像素构建图模型,然后采用条件随机场(CRF)模型对显著图进行细化处理,得到最终的图像显著图。实验结果表明,相对于当前的领先算法,所提算法能够取得较好效果。