论文部分内容阅读
基于内容的图像检索(CBIR)力图使用图像的视觉内容,在大规模图像库中寻找用户感兴趣的图像。从20世纪90年代开始,CBIR成为一个活跃的研究领域。CBIR面临的最大困难是图像的低层视觉特征与高层语义特征之间存在着巨大的差距,而机器学习技术的引入则有助于缓解该问题。因此,将机器学习技术应用到CBIR中,成为了目前CBIR领域的一个热门话题。
本文尝试将一些新型机器学习技术,主要包括多示例学习、主动学习和半监督学习,引入CBIR领域,以提高检索的性能。具体来说,本文主要取得了以下创新成果:
1.本文将多示例学习技术引入CBIR,提出了一种多示例图像包生成方法ImaBag,并设计实现了原型系统MillR。研究结果表明,ImaBag有助于取得较好的检索效果,并且与现有的多示例图像包生成方法相比,其效率更高。
2.本文将主动学习技术引入CBIR的相关反馈过程,提出了一种主动相关反馈方法,可以使用户反馈更有效地提高检索性能。研究结果表明,与传统的相关反馈技术相比,利用主动相关反馈方法可以在同等的反馈次数下达到更高的检索性能。
3.本文将半监督学习技术引入CBIR,基于协同训练范式,提出了一种协同检索方法,可以利用图像库中存在的大量无标记图像的信息。此外,本文还将协同检索和主动相关反馈相结合,提出一种主动协同检索方法。研究结果表明,上述方法可以有效地利用无标记图像的信息来提高检索性能。
4.本文针对CBIR中正、反例图像分布的不同,提出了一种正、反例区分处理的机制,并将该机制嵌入到主动相关反馈方法、协同检索方法以及主动协同检索方法中。研究结果表明,该技术有助于更有效地利用反例周围的无标记图像信息,从而进一步提高检索性能。