论文部分内容阅读
计算机技术、多媒体技术以及Internet技术的长足发展导致大量图象的出现,如何有效地、快速地从大规模的图象数据库中检索出需要的图象是目前一个相当重要而又富有挑战性的研究课题。基于内容的图象检索技术的研究正是为了解决利用自动获取的图象特征,从图象数据库中检索出相关图象的问题。近年来,此项技术的研究非常活跃,在许多领域都有应用。 本论文围绕基于内容图象检索中的一些关键技术,包括提取图象低层特征、图象间相似度的度量及相关反馈等技术,进行了一些探索性的研究,研究的内容属于目前图象处理和信息检索领域的研究重点,具有相当的理论意义和实际应用价值。 本文的主要贡献总结如下: 1. 深入分析和研究了基于内容图象检索领域的一些关键技术,如:相关反馈、颜色、形状、纹理等低层图象特征的描述以及图象间的相似性度量准则等。并且,通过在同一测试环境下的实验,对一些经典的方法进行了比较; 2. 提出了一个基于显著边缘的图象检索方法。它利用独立边界自增强算法来连结边缘和增强显著边缘,依靠增强后的结果,就能够较容易地提取图象中的显著边缘,使用显著边缘的特征代表图象的形状特征。然后,采用一种“多对多”的匹配策略来度量图象间的相似性,而这种策略允许图象中的一条显著边缘与另一幅图象中的多条显著边缘进行匹配,图象间的相似性由所有的有效匹配共同决定,它对边缘提取不准确具有一定的鲁棒性; 3. 提出了一个基于显著兴趣点的图象检索算法。此算法首先使用自适应滤波器对图象进行平滑,然后使用经典的兴趣点检测算法发现兴趣点。由于自适应滤波器具有平滑细节,增强显著边缘的功能,因此,这种方法能够保证兴趣点大都存在于图象的显著边缘上。接下来利用兴趣点周围区域的颜色特征来代表图象的特征,这样,兴趣点的形状特征就和其周围区域的颜色特征有机的结合起来,图象间相似度的计算就基于这种特征。实验证明,这个算法简单、有效; 4. 提出了一个基于图象中用户感兴趣物体的图象检索算法。这个算法的一个突出特点是:十分符合用户在检索时的主观思路。它首先对图象进行分析,提取出其中用户感兴趣的物体,再利用感兴趣物体的颜色和纹理特征来表征图象的特征,进行图象匹配和相似性度量计算。在这个算法中,核心技术——感兴趣物体的自动提取,结合视觉感兴趣模型和图象分割中的区域增长技术来实现。大量的实验结果表明,此检索方法相当有效。而且,图象中感兴趣物体的自动提取技术还可以应用到其它领域,如基于内容的图象压缩,目标识别等; 5. 提出了一个基于Variogram函数的纹理图象分析和检索方法。此方法将两种不同类型的纹理——规则纹理和不规则纹理的分析和检索统一到一个框架摘要下。在检索之前,利用物riogram函数,根据图象的特征,自动预测查询图象的纹理类型,然后,对于不同类型的纹理,采用不同的策略去分析。对于规则纹理,使用较大的尺度提取其周期性和方向性;对于不规则纹理,则使用较小的尺度以观察其随机性。根据提取的纹理特征,计算纹理谱和自带纹理表,最终形成特征矢量,来进行相似度度量和图象检索。实验证明,此方法相当适合于实际的图象检索系统;6.提出一个记忆学习的图象检索模型。此模型将长期学习与短期学习结合起来 以提高检索效率:首先,通过搜集用户相关反馈的信息组成一个图象语义连 结网络,此网络能够纪录图象间符合用户主观的语义层相似度;其次,根据 语义连结网络,进行图象在语义层的分类,进而估计图象之间潜在的语义相 似度;最后,图象间的相似度由三个因素来决定,视觉特征、语义连结网络 和潜在语义。在此模型中,长期学习是指从记忆的大量用户日志中学习语义 信息的过程,而短期学习是指常规的相关反馈过程。长期学习与短期学习的 关系是:长期学习依靠短期学习的积累,而短期学习需要长期学习来指导。 大量的实验证明,此图象检索模型的检索准确率相当高,且能够满足用户的 多种查询请求。