论文部分内容阅读
随着社会生活水平的提高,旅游活动变得越来越普遍,伴随着旅游活动的普遍性和旅游人数的增加,旅游中的突发事件也越来越多,旅游活动中的突发事件难以预测,对旅游场景识别和监测是提高对旅游突发事件应对水平的有效手段。如何针对这些跨媒体数据进行语义学习和实现旅游场景识别和监测是一个严峻挑战。针对旅游场景识别,一方面要提高识别的准确率,另一方面要对场景的语义进行理解,最终实现场景识别和旅游场景监测。本文完成的主要工作如下:(1)针对基于场景属性语义的场景识别效率低和人群场景分析具有时空局限性的问题,提出了场景属性语义关系特征提取算法(SASF)和基于密度场特征的人群场景分析算法(DFCS)。场景属性语义关系特征提取算法可解决场景属性语义稀疏性和由于场景属性语义不充分导致的场景语义识别效率不高的问题,实验结果表明该算法有更高的识别准确率,并且提升了特征的可分性。基于密度场特征的人群场景分析算法能够进行有效地人群场景分析,克服了运动人群场景时空不一致情况下的人群规模估计和人群分布估计问题,实验结果表明该算法能够准确地得出人群密集分布状态和人群规模,比当前主流算法的性能有明显提升。(2)针对跨媒体数据中累积属性语义数据的稀疏性和不平衡性问题,提出了基于深度卷积神经网络的累积属性语义学习算法(BDAL)。设计了用于累积属性语义学习的深度卷积神经网络结构,将基于时空特征的人数估计模型与基于深度卷积神经网络的累积属性语义学习模型进行后融合,提升了累积属性语义学习性能。为了验证提出的算法,将其应用于具有典型累积属性语义特征的人群人数估计问题中,通过快速运动目标分割,得到运动区域,提取运动区域超像素块的局部时空特征,实现超深度累积属性语义学习。实验结果表明提出的算法的平均绝对误差和平均平方误差指标比当前主流方法有明显的降低,说明提出的算法能够提升累积属性语义的学习性能,实现了对人群的有效估计。(3)针对跨媒体数据之间难以实现语义映射,并且难以构建跨媒体语义映射模型,提出了基于跨媒体属性语义学习的旅游场景识别算法(ARSL)。利用场景属性的语义关系构建语义关系拓扑图,通过语义关系拓扑的约束提升场景的属性识别的准确率,基于属性学习构建了场景识别模型,实现了旅游场景识别。分别在旅游场景图像数据集和旅游人群场景视频数据集上进行实验,实验结果表明提出的算法的平均场景属性识别准确率比主流的方法高。在旅游人群场景视频数据集的实验中,提出的算法的平均属性识别准确率比目前主流方法都有所提升,提升了旅游场景属性识别的性能,表明了提出算法的有效性。(4)针对旅游场景突发事件难以预测问题,提出了基于人群场景类型识别的场景监测算法(CTRNM)。根据人群行为特征、情绪特征和组织性特征对人群场景类型进行了分析,建立了基于双流深度卷积神经网络的人群场景类型识别模型,得到了基于人群场景类型的场景监测规则。为了验证提出的基于人群场景类型识别的场景监测算法在数据集上进行了实验,实验结果表明提出的算法能够有效地识别人群场景的类型,并对人群场景进行了监测。(5)综合本文提出的场景属性语义特征提取算法(SASF)、基于密度场特征的人群分析算法(DFCS)、基于时空特征和深度卷积神经网的累积属性语义学习算法(BDAL)、基于跨媒体属性语义学习的旅游场景识别算法(ARSL)和基于人群场景类型识别的场景监测算法(CTRNM),实现了跨媒体数据语义学习与旅游场景识别和监测系统。该系统可实现人群场景分析、人数估计、旅游场景识别和旅游场景监测。