论文部分内容阅读
                            
                            
                                目前,以搜索引擎为代表的信息检索系统一般仅能通过人工设置的文字标签衡量图像等多媒体信息与检索关键词的相关性,而非使用多媒体信息本身所包含的内容进行检索。为了在图像检索上提供更为直观与便捷的体验,基于内容的图像检索(Content-Based Image Retrieval,CBIR)领域的研究具有非常重要的意义,但是传统的CBIR方法只能对图像的整体实现检索。因此,研究者进一步提出了基于内容的目标检索(Content-Based Obiect Retrieval,CBOR)。CBOR能够利用图像的局部信息实现基于内容的检索。在视频中进行基于内容的检索则是该领域的研究热点。视频中包含的信息量庞大。传统的CBOR方法应用于视频中的目标检索之时,无法充分利用视频的特点;现有的在视频中进行内容检索的方法在存储空间消耗、抗干扰能力、检索速度等方面都亟待改进。  
 本文根据视频中基于内容的目标检索方法特性及需求,总结目标检索过程中的关键技术,并针对其中的紧迫问题提出了创新的解决方案。主要研究内容如下:  
 1.特征压缩技术。针对局部特征,提出基于运动预测的压缩特征描述方法;针对主方向模板特征,提出基于梯度方向表示简化的紧凑表示方法。  
 2.抗干扰技术。针对主方向模板匹配,提出基于相似度映射图并最大化可见部分的改进方法用于处理局部遮挡,并提出流程精简的目标检索方法;针对水平集轮廓跟踪,提出基于动态异常处理的改进方法用于处理遮挡与色块融合。  
 3.快速定位技术。针对水平集轮廓跟踪方法,提出两种兼顾速度与鲁棒性的前景提取方法,进一步提出基于感兴趣区域预处理的水平集轮廓跟踪方法,并应用于人脸跟踪;针对基于局部特征的目标检索,提出快速区域搜索方法以及基于压缩特征描述和快速区域搜索的目标检索方法。  
 深入的分析和充足的实验表明,本文提出的方法在鲁棒性、速度等方面的性能指标上优于现有方法。