论文部分内容阅读
近年来,大型公共场所的人群活动愈来愈频繁,合理管理大规模人群活动具有深远的研究意义。智能人群监控系统能够实现全天候的人群管理,减少公共场所的安全隐患。本文旨在研究复杂环境下人群流量监控的关键技术,实现准确、鲁棒、适应性强的人群流量监控系统。本文主要工作和贡献归纳如下:
首先,针对行人流量监控领域缺乏专业数据库的现状,本文创建了CASIA行人计数数据库。该数据库包含大量实际监控场景下采集的视频、图像数据和标注信息,致力于为行人计数算法提供公开公正的评测平台。本文着重介绍了该数据库的数据采集、组成、标注、使用方法和特点。同时,归纳分析了区域行人计数和通道行人计数算法的评测指标。
基于视频的行人监控系统会面临各种不同的应用场景,视频图像中行人目标和监控背景都存在很大差异。为了提升系统的性能,现有的行人计数系统通常对特定场景中行人和背景样本进行离线采集和模型训练,这项耗时繁琐的工作大大降低了系统的实用价值。为此,本文提出了两种基于不同模型的具备在线自适应学习功能的区域行人计数算法:
本文提出一种基于基于视觉词袋模型的在线自适应学习行人计数算法。该算法在创建初始视觉词袋模型的基础上,首先针对应用场景自动采集高置信度样本,并提出一种基于视觉词袋模型的实时更新算法,使系统能够自动获取并适应当前场景下行人目标和背景图像的特点,实现在线自适应学习功能。
本文提出一种基于混合高斯模型的在线增量学习算法。该算法通过在线采集高置信度样本实时调整模型各项参数,使模型快速适应不同应用场景,提高系统的适应能力和计数准确性,有效地避免重复离线训练过程。
针对高密度人群的监控场景,本文提出了一种能够较为准确地统计拥挤场景下区域行人数目的方法。该方法采用底层特征映射和基于目标检测的非行人前景抑制相结合的方法来实现人群块的行人数目统计,以减轻遮挡和非行人运动物体或光照变化对系统计数准确性带来的影响。
针对视野宽阔的监控场景,本文提出了一种基于多摄像机的行人计数系统。其中,多摄像机视野范围重叠区域内的行人目标匹配是该系统需要解决的关键问题,为此本文提出一种粗匹配、细匹配两步匹配算法。粗匹配过程得到场景间的关联信息(即图像间的映射关系);细匹配则是抓住同一行人目标的特性进行匹配,本文提出针对行人目标的区域、轨迹、外观特征的相似性度量方法以实现不同摄像机视野重叠区域内行人目标的最优匹配,并融合多摄像机的计数结果,最终得到大场景下的行人数目。
综上所述,本文主要致力于解决复杂环境下行人流量监控的关键问题,有效提升监控系统的实用价值。