论文部分内容阅读
随着数码相机的普及以及网络的快速发展,图像数据的种类和信息越来越多。为了从这些丰富的图像数据中快速且有效地找到所需要的信息,有关图像处理技术的要求与日俱增。图像检索技术成为热点之一,其中基于内容的图像检索(Content-Based Image Retrieval,CBIR)技术更是得到广泛的关注。CBIR提取图像的底层特征比如颜色特征、纹理特征、形状特征等来表示图像,通过特征来计算图像间的相似性,建立图像间的视觉链接。如果一个用户正在看一幅图,其他方面相似的图也可能会引起这名用户的兴趣,这就是所谓的视觉链接的机制。随机游走模型是一种抽象概念模型,它主要是针对浏览网页的用户行为所建立的。很多链接分析算法都是以随机游走为模型发展而来的。若将图像看成是图上的点,图像间的视觉链接看成是随机游走的转移概率,则基于内容的图像检索问题就可利用随机游走模型来解决。目前国内外几大著名的搜索引擎基于输入的关键词,给出已排序的检索结果,然而这些检索结果一般按照相关的程度进行排序,即相关度越高,排序越高,这就使得排在顶端的检索结果可能大多是重复的,从而呈献给用户一个比较局限的视野。当用户的查询意图较模糊或者关键词具有多语义性时,用户可能不得不点击较多网页才能找到所需要的图像信息。针对以上问题,本文做了如下研究工作。具体工作如下:1.本文将Rank Compete算法扩展到流形结构上,提出基于两条随机游走(Two Random Walks,TRW)的图像检索算法。当只关注图像相关性和不相关性时,与基于流形排序的图像检索(Manifold-Ranking Based Image Retrieval,MRBIR)算法相比,该算法可达到较高的检索率。2.本文将基于两条随机游走算法推广到多条随机游走模型上,并利用最近邻传递谱聚类将其改进,提出自适应多条随机游走(Adaptive Multiple Random Walks,AMRW)算法。从而实现在多条随机游走模型下,可以自适应地选择代表性图像并将其用于多语义图像检索,呈献给用户一个多样性的视野。