论文部分内容阅读
随着多媒体技术的快速发展和数字技术的普及应用,使得多媒体数据信息(包括图像、音频、视频等)大量出现。如何快速、有效的从海量的信息资源中检索到所需信息,现已成为多媒体技术研究领域的一个热点问题。基于内容的图像检索(CBIR, Content-based Image Retrieval)技术就是为了解决上述问题提出的。CBIR技术是利用图像本身的性质(如颜色、纹理、形状、空间关系等),并借助计算机视觉、图像处理和模式识别等技术来实现图像的有效检索。图像的性质中,形状特征比较符合人们的视觉感知,人们倾向于选用形状特征实现图像的检索。但是,形状特征本身固有其特殊性,使得根据形状特征进行图像检索,具有一定的难度,因此基于形状的图像检索技术是CBIR技术中一个极具挑战性的研究课题,具有非常重要的研究意义与发展前景。本文首先介绍了CBIR技术和基于形状的图像检索的研究背景、现状以及用到的相关技术,同时对基于形状特征的图像检索中的关键技术进行了介绍和分析。并针对图像边缘特征提取中,常用的边缘特征提取算法计算量大,复杂度高的缺点,本文引入了利用曲波变换(CT, Curvelet Transform)算法来提取图像的边缘信息。然后,针对利用传统的SIFT(Scale-invariant Feature Transform)算法提取出的图像特征点向量维数较多,计算量大,检索效率低等缺点提出了一种基于SIFT和主成分分析(PCA, Principal Component Analysis)相结合的SIFT-PCA算法。该算法先利用SIFT算法获得图像特征点向量,然后通过改进的PCA算法把提取出的特征点向量变换到另一个空间,获得有代表性的特征参数,达到对特征点向量的降维。此算法在保证原SIFT算法鲁棒性的同时减少了计算量,并且增强了实时性。最后,利用本文设计的图像检索系统,将传统的形状特征提取算法和本文提出的利用CT算法提取图像的边缘信息、SIFT-PCA算法提取图像的关键特征点,以及融合这两种特征进行检索实验,验证了本文提出的图像检索方法的有效性和实用性。本文通过一个标准Corel数据库,一个Coil-100彩色图像库,一个常用图像库MPEG-7图像库和P1100商品图像库,对本文提出的算法进行了实验设计与分析,通过实验说明算法的有效性和鲁棒性。实验结果表明,本文算法比一些常用特征描述算法更能有效检索图像。