论文部分内容阅读
近年来,伴随着视频监控系统建设规模的不断扩大,人们对视频监控系统的高效应用和管理也提出了越来越高的要求。传统的视频监控系统对于视频中的具体内容只能依靠人工进行分析判断,在处理大规模的视频信息时效率十分低下。在公安行业中,警务工作者为了查找监控视频中的某个可疑人员,不得不依靠人眼去浏览大量的监控录像,这样就导致了巨大的时间和人力资源浪费。如何快速有效地从监控视频中检索出某个特定人员是一项重要而迫切的研究课题。 智能化的视频监控系统利用计算机替代人工来对监控视频数据进行智能处理,将人们感兴趣的关键信息从海量的视频数据中快速自动提取出来。作为智能化视频监控中的一个热门话题,行人检索技术能够帮助警务工作者查询所关注的特定行人目标在其他监控视频中是否也出现过,这可以大大减轻警务工作者的负担。本文结合国内外研究现状以及实际应用情况对行人检索方法展开研究,主要从检索效率入手,提出一种快速行人检索方法,在确保检索准确率的同时,提高检索的速度。本文的主要工作包括: 首先,通过对目前目标检测方法的研究,采用梯度方向直方图HOG作为检测特征,支持向量机SVM作为分类方法检测行人目标,并且使用积分图来加速梯度方向直方图的统计过程,以缩短行人检测的时间。 然后,提出了一种基于人体划分的MSCR-SIFT特征提取方法。利用对称性和非对称性的感知原则将人体划分为四个部分,使得之后的视觉词典构建过程中视觉词汇能够包含其所处人体位置的属性。在检测特征区域时采用MSCR方法检测人体各个部分的最大稳定色彩区域,并对SIFT描述子做一定的调整,使之能够用于MSCR区域的特征描述,这样不仅能够保持SIFT的优点,而且还能提高特征提取的速度。 最后,提出一种基于词袋模型和倒排索引的快速行人检索方法BOW-Ⅱ。对于数据集的所有MSCR-SIFT特征描述子,利用词袋模型的思想构建视觉词典和倒排索引,以加速行人检索的匹配过程。在检索目标图像的时候,利用目标图像的每个特征描述子所映射的聚类中心查询倒排索引表,依据候选图像出现次数之和对匹配结果进行排序。