论文部分内容阅读
在大型集群场景的监控视频中,由于摄像头呈高远倾斜视角挂置,目标在视频中的形态信息相似,目标之间遮挡严重,传统的跟踪器很难获取单个目标的准确的、长时间的运动信息。为了能在这样的监控场景中进行目标的行为分析,首先需要选取合适的跟踪器来获取单个目标的短时运动信息;这些短时的运动信息被称为短轨迹;然后,根据数据在时空中的关联信息来连接这些短轨迹。但是,在集群场景中目标的运动时空重合度高,被连接的轨迹不等长且各类运动混杂在一起,不能有效表达集群行为的特性。为了更加判别的表达表达这些集群的行为,改进的主题模型被用来对这些特征进行词包编码,然后利用主题模型分层的结构对数据进行降维聚类,实现对集群行为的语义特征表达。 首先提出了基于信念的关联主题模型(BCTM),这个模型被用来学习轨迹的中层统计特征。这些中层特征被用来对轨迹进行聚类,聚类的结果可以有效的揭示在场景中的集群行为。这里的信念指的是场景中的进出口先验,因为场景中每一个目标都有确定的目的地,所以把这些先验称之为信念。混合高斯分布被用来对轨迹的起止点进行聚类,由此来判断在场景中目标的进出口区域。BCTM模型可以利用这些先验来计算轨迹之间的聚类信息,同时推断出集群行为的中层语义信息。这个模型在中层特征推理和轨迹聚类性能上超过了关联主题模型(CTM)和随机场主题模型(RFT)。BCTM模型的输入是原始的轨迹片段,输出的中层特征被输入到一个分层聚类算法,每一个轨迹片段都可经由这个算法获得聚类标号。 BCTM模型很好的解决了在集群场景中轨迹片段聚类的性能问题,但是在现实场景来说,每一个场景中的进出口场景先验都不一样,而且,由于摄像头挂置的角度和距离问题,场景也会存在进出口的模糊和歧义。为了提高模型的适用性,同时不降低由模型推理出的特征的判别力,在去掉进出口先验的同时,在模型初始化阶段,导入数据在低维流形上的结构关系来辅助特征的推理。基于这样的设计,聚类隐狄利克雷分布模型(CLDA)被提出用来完成上述任务。CLDA通过嵌入低维流形聚类初始化,然后迭代进行统计推理,不断优化聚类信息。现有理论表明图像类数据总是分布在低维的结构化的流形空间上,这个理论是提出CLDA模型的理论前提。 CLDA模型通过低维流形初始化和利用这个聚类关系来迭代优化中层特征的推理,很好的解决了模型适应性和判别力之间的矛盾。因为始终假定,不论是什么样的场景,只要是视频图像类数据,都会在低维空间呈现出聚类现象。但是,在主题模型推理的过程中,生成模型概率1和限制使得底层的聚类信息,在中层特征提取的过程被重新混杂在一起。为了解决这样一个问题,除了需要开始阶段引入合适的初始化运算之外,还需要在推理阶段基于局部的时空信息,来确保底层的聚类信息可以有效的被传递到中层。基于这样的设计,局部一致的隐狄利克雷分布模型(LC-LDA)被提出用来完成上述任务。该模型使用轨迹片段作为输入,词包特征是被提取的底层特征。在时空上相邻的两条轨迹,在LC-LDA的中层特征之间有统计关联作用,这个关联作用被转化为求解时的局部约束算子。这个算子有效的描述了数据在低维流形空间的局部一致性,反映了数据在词包空间的聚类特征,这就使得推理出的集群行为模式比起CLDA模型有了更强的判别性。集群场景中目标的行为分析离不开对集群的跟踪和相应场景的识别。根据现有工作,LC-LDA也被应用到集群组跟踪和场景分类的任务中,校验了LC-LDA模型的有效性。