论文部分内容阅读
近年来随着互联网科技高速发展,网络上的图像、视频等多媒体信息数据急剧增长。这使得如何高效快速准确的对这些海量数据进行管理、索引和检索成为当今信息检索领域的一个重大难题。而解决其有效方法之一就是通过对互联网图像进行图像标注,建立图像底层视觉特征与高层语义内容之间的联系,利用标注来对图像进行管理和检索。因此图像标注逐渐成为国内外研究的热点问题,关于图像自动标注的各种研究也更加深入和多样化。本文的研究内容主要是在图像已被标注的前提下,针对图像标签不能完全描述图像内容的问题,对其进行属性标注补充,完善标注对图像语义描述的全面性和完整性,进而能够将图像标注更好的应用到图像检索之中。其主要思想是先确定标注在图像中的相关性区域,再通过对该区域进行内容分析为标注增加对应的属性标注。本文的研究内容及主要创新点如下:(1)在已有的研究基础上对图像底层特征的选择和提取做出了一定的改变和优化。本文中综合选取了三种合适的图像特征,同时考虑了图像区域的空间位置信息,并对最后得到的特征向量进行量化。实验表明,这种方法降低了运算的时间和空间复杂度。(2)提出了一种基于近远邻投票机制以及多样性密度算法思想的方法来计算区域与标注之间的相似度。该相似性的度量是本文中的核心问题,本文中改进了原本的Score值计算方法,将与目标图像块距离较远的k远邻图像作为反包考虑在内,并且增加了作为正包的k近邻图像在Score值计算公式中的权重。通过实验验证表明,考虑了作为反包的k远邻图像,并调整了正包与反包的权值后,所得到的Score值的方差更大,改善了其对不同标注的区分度,有助于我们进行后续相关性标注的判断。(3)为了提高所增加补充的属性标注的准确率和可靠性,本文中还利用已有标注的先验知识来构建属性标注优先级表。在增加属性标注的同时,并在颜色、纹理和形状标注等三个方面的补充过程中,采用优先级表来辅助判断来提高其标注补充的正确性。该方法能够较好的考虑到已有标注的先验信息,有助于提高标注补充的正确率。