【摘 要】
:
随着城市生活水平的提高,公民对公共安全的关注度越来越高。但是,近些年因为大规模人群聚集活动导致的安全事故时有发生。因此,利用智能监控系统对人群密集场景下的人群数量、密集程度以及潜在的安全事故风险进行预测,为人工管理提供参考信息是很有意义的。近年来,基于人群密度估计的人数统计领域不断发展,现有的人数统计方法已经达到了较高的准确率,但是这些算法需要具有强大计算资源的硬件设备进行支持,且算法的推理时间长
论文部分内容阅读
随着城市生活水平的提高,公民对公共安全的关注度越来越高。但是,近些年因为大规模人群聚集活动导致的安全事故时有发生。因此,利用智能监控系统对人群密集场景下的人群数量、密集程度以及潜在的安全事故风险进行预测,为人工管理提供参考信息是很有意义的。近年来,基于人群密度估计的人数统计领域不断发展,现有的人数统计方法已经达到了较高的准确率,但是这些算法需要具有强大计算资源的硬件设备进行支持,且算法的推理时间长,存在无法满足实时人数统计需求的问题。本论文围绕人群密集场景下的人数统计任务,基于云端结合的思想,设计了两种人数统计方法。同时,基于本论文所设计的两种人数统计方法开发了基于云端结合的智能人数统计系统,为人群密集场景下的人群监控管理提供实时的人数统计服务。本文主要工作内容如下:(1)针对人群密集场景因人头尺度变化大而导致基于人群密度估计的人数统计方法准确率低的问题,提出了人数统计方法MSANet。该方法针对高人群密度、人头尺寸变化大、遮挡严重场景下的人数统计任务的特点,提出了用于人群密度估计任务的人群扩张卷积池化金字塔模块,并精心设计了模块中扩张卷积操作使用的扩张率,来提取人群特征图中多尺度语义信息,以提高对人头尺度变化的处理能力。引入了注意力机制,使用注意力掩膜对模型“中间”特征图的背景部分进行优化。实验结果表明,基于人群密度估计的人数统计方法MSANet,能较好的处理人头尺度变化,提升人数统计算法的准确率。(2)针对现有人数统计方法计算资源要求高、计算耗时长、无法满足实时人数统计需求的问题。本论文提出了基于人群密度估计的轻量级人数统计方法DDSNet,该方法使用本论文中提出的扩张深度可分离卷积模块构建模型的编码器,扩张深度可分离卷积模块相比于标准卷积计算大大降低了参数量和计算复杂度。实验结果表明,DDSNet对比现有的人数统计方法,能以更少的参数量、更低的计算复杂度、更快的速度获得良好的检测精度。(3)以本论文提出的MSANet方法和DDSNet方法作为人数统计核心算法,基于云端协同处理的模式,设计并开发了基于云端结合的人数统计系统,为高密集场景下的人群监管提供了重要的参考信息。
其他文献
单通道时频混叠信号分离是近几年来通信领域的重要研究,因其特殊的接收模式以及接收信号的时频域重叠的特性,故无法通过传统的滤波实现信号分离。该课题主要是研究单一传感器接收多个时频域重叠的信号组成的混合信号的分离问题。在此背景下,本文将针对该类问题的解决方案展开研究。主要贡献如下:1、针对基于多尺度分解的信号分离算法下小波基的选取问题进行了研究。首先,搭建了基于多尺度分解的信号分离算法的模型,通过对该算
茶文化由国人的饮茶之习发展而来,禅文化则由印度禅佛教在中国的本土化发展而成,禅茶文化借助饮茶来拉近禅与人们的心理距离,提出参禅如饮茶,由此延伸出“禅茶一味”的思想和审美情趣。本文以“禅茶一味”的审美视角探究首饰的艺术表达,关注中国传统文化下的造物美学、禅茶联姻的文化现象及“禅茶一味”审美情趣的形成,回顾现代首饰的形态发展和设计规律,找寻禅茶文化与现代首饰设计间的关联。探索在多重问题暴露的社会环境中
近年来深度神经网络模型已经成为人工智能领域的研究热点,包括了语音识别、图像理解、视频检测等方面的应用,但是随着神经网络的不断发展,后续的研究对神经网络在精度与速度方面的要求也越来越高,也使得网络模型的结构越来越复杂,参数越来越多,对应用场景与应用设备的要求也越来越高。于是,模型压缩概念方法被提出,模型压缩旨在保持网络的精度的同时,减少网络模型的参数量,从而减小模型的大小,提高网络的推理速度,使得网
近几十年来,随着综合国力的不断提升,我国在航空领域取得了较为突出的成就,空中飞行器的种类和数量都在不断增长,但与此同时如无人机“黑飞”、滥飞”等事件也时有发生,给我们的生活带来各种安全隐患。从大量图像数据中对这些空中目标进行自动部位识别能够方便相关人员对空域进行的活动实行有效的监管,优化空域管理,减少人力成本,提高工作效率。本文基于语义分割对空中目标部位识别算法进行了研究,主要工作如下:(1)构建
神经机器翻译是将一种语言的文本翻译成另一种语言的同义文本的任务,是自然语言处理的一个十分热门研究方向。如今,神经机器翻译在越来越国际化的社会起着至关重要的作用,其大都是基于序列到序列框架构建的,该框架包括一个编码器和一个解码器。编码器负责将输入的源序列映射到一个语义空间;解码器根据编码器的结果迭代地预测出目标序列。序列到序列模型的编码器的训练过程和测试过程是相同的,都是将源序列编码到一语义空间,但
互联网的开放性使得用户可以在网上对参与过的活动发表评价,同时也为其他用户提供决策参考。爆炸式增长的信息量使得人工分析变得困难,对这些来自用户的评论进行自动化情感分析,具有较高的理论分析和实际应用价值。方面级情感分析是一种细粒度情感分析任务,基本的任务目的是寻找评价的对象以及对应的情感极性,也因此更具有挑战性。方面级情感分析有许多子任务,其中最基本的是方面词抽取以及方面情感分类。本文从三个方面讨论了
个人所得税是一个极具增长潜力的税种,随着个人所得税收入的扩大、地位的提高,其对调整收入分配和增加财政收入的影响巨大。自2019年修订新《个人所得税法》后我国不仅在法律上改革了个人所得税制度,也逐步将着力点落在了提升个人所得税的征管水平上,但目前个人所得税征收和管理的改革一直落后于税收制度的改革,导致目前的个人所得税制仍然难以全面落实。面对电子商务和信息技术的迅速发展,个人收入来源的差异化和隐蔽性逐
地震反演是将地震资料转化为地下介质岩性和含油气信息的重要技术手段。由于地震数据具有带限特征和噪声干扰影响,导致地震反演存在低分辨率及多解性问题。主要体现在垂向地震道高频和低频部分缺失和横向多道地震数据的不连续性。解决反演分辨率问题最直接的方法就是通过正则化手段加入高频和低频信息进行约束反演,比如通过假设高频信息满足特定数学假设实现对地震数据的频带拓宽。有研究表明,常规特定数学假设不满足实际地层条件
相比于传统的成像方式,基于光场的成像方式在记录场景中光辐射的位置信息的同时,也记录了光辐射的方向信息。光场图像“单曝光多视角,先拍摄后聚焦”特点为被动式深度估计方法打开了新的思路,具有重要的研究意义。然而如何在充分利用四维光场信息的同时,解决光场图像基线窄、遮挡区域深度估计误差大等问题是该研究的重要课题。本文研究的主要工作内容包括:1)提出基于稀疏AD-Census及十字多视点的匹配代价计算方式。
随着城镇化与公共基础设施建设的不断推进,施工项目的数量与日俱增,而由于建筑工人安全意识不强,在施工现场每年都会发生大量因安全违规导致的安全事故。定期开展安全培训与安排安全巡视员进行现场巡视等手段对于降低工地安全事故率只能起一时之效,无法时刻对施工现场的安全违规进行监督。近年来,以工地上广泛安装的监控摄像头作为视觉终端,利用计算机视觉技术对施工现场的工人违规行为进行安全预警是一个新的研究热点,并且对