论文部分内容阅读
人体目标是视频监视场景中最为重要的—类目标,其数量指标在许多实际应用中都具有十分重要的作用。因此,基于视频监视的人数统计技术研究能产生直接的经济效益和社会效益,尤其是对日益突出的公共场所人群安全问题的解决具有十分重要的意义。
本文系统地研究了智能视频监视中的人数统计问题。该问题包括两个方面的含义:(1)通过监视场景的行人数量;(2)监视场景中聚集的人群数量或人群密度范围。本文研究针对实际应用中的普通数字视频监视设备,因此,要求人数统计方法的时间复杂度较低,要能在普通视频监视系统上实现实时监视。
本文针对几类不同的典型应用就该问题分别作了研究,提出了各自的解决方法。其主要内容包括:
1、针对小场景稀疏行人目标通行情况,本文使用了运动分析方法来统计通过监视场景的行人目标数量。在场景设置上,通过垂直拍摄的方式以减少目标之间的相互遮挡。在目标检测阶段,研究了基于邻帧差分法和背景差分法的目标象素检测方法,并就背景差分法提出了—种基于分块策略的快速背景重建方法;在目标提取阶段,使用了一种投影分割方法来快速定位差分图象中的目标区域,并根据目标大小的统计规律对目标粘连情况作了处理;在目标跟踪阶段,根据场景目标运动的先验知识,对前后两帧图象通过目标检测、提取出来的目标形成的集合,提出了一种基于两个目标集中的目标对应匹配的方法来快:速跟踪目标的运动,并根据目标运动的时域连续性分析,对前面阶段的目标误检、漏检情况进行纠正。
2、同样针对小场景稀疏行人目标通行情况,在诸如动态背景等不适合使用图象差分方法进行目标检测的情况下,本文提出了另一种基于人脸检测与跟踪的运动分析方法来统计通过监视场景的行人目标数量。在场景设置上,通过水平或俯视拍摄的方式尽量正对目标的人脸区域。整个方法基于一种“宽误检、严漏检”策略。在目标检测阶段,使用了一种RGB颜色空间下的宽条件肤色聚类分割方法来检测目标象素;在目标提取阶段,针对因图象中广泛存在的人脸目标三维姿态变化而无法使用正面人脸灰度分布模式进行检测的情况,提出了一种宽条件目标分类规则的方法来提取人脸目标,以尽量保证对目标的检测没有遗漏;在目标跟踪阶段,也使用了基于目标集中的目标对应匹配方法来快速跟踪目标的运动及纠正误检情况。
3、针对单向密集行人通行情况,本文提出了一种基于统计分析的方法来估计通过监视场景的行人目标数量。研究中首先从人眼视知觉对这种情况下的通行人体目标数量估计的原理分析出发,假设图象灰度变化与通行人数之间存在相关关系;然后使用回归分析的方法分析、验证了上述两个统计量之间的相关关系;最后根据相关分析的结果来估计通行人数。
4、针对大场景聚集人群隋况,本文提出了一种基于统计分析的方法来估计场景人数。研究中首先使用主成份分析方法分析了表征图象纹理特征的灰度共生矩阵各指标之间的相关关系及其不同的重要作用,然后使用回归分析方法分析了四个重要指标与场景人数之间的相关关系;最后根据相关分析的结果来估计场景人数。 5、同样针对大场景聚集人群隋况,在因拍摄距离较远、图象模糊等原因难以获得人数统计量而无法估计场景人数的情况下,本文提出了一种基于模糊神经网络分类的方法来估计场景聚集人数的密度范围。研究中首先根据人眼在人群密度范围估计问题上的模糊性原理,认为用模糊的方法来划分^群密度范围比用确定的方法划分人群密度范围更符合人眼视知觉的认知方式;然后利用统计的方法确定了图象灰度共生矩阵各指标对于各个密度类别的隶属函数,并设计了一个基于误差反向传播训练算法(BP)的模糊神经网络;最后,经过训练后的网络用于计算样本模式对于各个人群密度类别的隶属度,并可根据人群密度变化的时域连续性原理用网络输出的模式隶属度对人群密度范围作出合理的解释。
通过各部分研究内容的实验结果分析,证明了这些方法在解决实际视频监视应用中的人数统计问题上的有效性。