基于目标检测与深度估计的施工现场安全预警关键技术研究与实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:wangyiming1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城镇化与公共基础设施建设的不断推进,施工项目的数量与日俱增,而由于建筑工人安全意识不强,在施工现场每年都会发生大量因安全违规导致的安全事故。定期开展安全培训与安排安全巡视员进行现场巡视等手段对于降低工地安全事故率只能起一时之效,无法时刻对施工现场的安全违规进行监督。近年来,以工地上广泛安装的监控摄像头作为视觉终端,利用计算机视觉技术对施工现场的工人违规行为进行安全预警是一个新的研究热点,并且对于保障工人的生命安全与工地的生产安全有着重大意义。针对施工现场安全预警,本课题主要完成了两个子任务:一是检测施工现场的工人是否佩戴有安全帽,二是检测施工现场的工人是否处于重型设备的危险工作区域。对于安全帽佩戴检测任务,现有的基于行人检测的方法由于遮挡问题,检测精度不高,基于人脸检测的方法又存在场景限制问题,模型的泛化能力不强。因此,本文提出了一种直接检测人头是否佩戴安全帽的检测方法。论文的主要工作包含以下几点:1.将佩戴安全帽的人头与未佩戴安全帽的人头分别看作不同的整体进行分类标注,构建了一个规模更大、多样性更高的安全帽佩戴检测数据集;2.对Cascade R-CNN目标检测算法通过骨干网络替换、增加可变形卷积DCN(Deformable Convolutional Networks)或可切换空洞卷积SAC(Switchable Atrous Convolution)进行网络改进得到了一个可以自适应目标尺度变换的多尺度安全帽佩戴检测网络结构,并在构建的安全帽数据集上进行训练与测试,性能指标计算结果表明训练得到的安全帽佩戴检测模型在佩戴安全帽的人头检测上最高取得了92%的AP(Average Precision)值,在未佩戴安全帽的人头检测上最高取得了94%的AP值,模型的m AP(mean Average Precision)值比当前最好的检测模型提升了7.01%,达到了92.9%;3.根据目标尺寸、拥挤遮挡程度以及光照等因素分为7个场景进行可视化对比测试,测试结果表明本文的安全帽佩戴检测模型与当前最好的模型相比在各种场景下都取得了很好的结果,证明了模型受拥挤遮挡、光照、尺度变换等因素的影响较小,验证了本文提出的多尺度安全帽佩戴检测网络结构的可靠性。对于检测施工现场的工人是否处于重型设备的危险工作区域任务,论文的主要工作包含以下几点:1.构建了一个由行人与重型设备两类目标组成且标注有Mask信息的数据集,并在Cascade Mask R-CNN目标检测算法上进行训练,训练后的模型用于提取工人与重型设备的Mask轮廓;2.提出了一种新的基于行人检测技术的像素焦距自标定算法,并在KITTI数据集上验证算法的有效性;3.提出了一种针对行人的深度重构算法和针对重型设备的滤波去噪算法;4.根据转换原理将RGB图像上的2D目标转换成点云空间中的3D目标进行处理,提出了一种点云空间安全预警算法。通过在构建标注的视频数据集上进行测试,算法的预警精度达到了95.99%,此外,点云空间可视化测试结果表明,算法在两个视频数据集上的预警效果都很好,验证了本文提出的点云空间安全预警算法的可靠性。
其他文献
近年来随着军民融合大趋势的深入发展,3mm频段除了在毫米波雷达、电子对抗、精确制导、保密通信等军事国防领域处于各国争抢的制高点,在如毫米安检成像、5G毫米波通信、跑道异物检测、汽车防撞系统等民用领域中也越来越备受关注。支撑各领域蓬勃发展的前提是3mm频段器件的研发与应用,然而3mm频段矢量网络分析仪对毫米波器件开发测量必不可少。因此研制矢网3mm频段扩频组件关键部件,实现老旧型号矢网以低成本实现扩
学位
单通道时频混叠信号分离是近几年来通信领域的重要研究,因其特殊的接收模式以及接收信号的时频域重叠的特性,故无法通过传统的滤波实现信号分离。该课题主要是研究单一传感器接收多个时频域重叠的信号组成的混合信号的分离问题。在此背景下,本文将针对该类问题的解决方案展开研究。主要贡献如下:1、针对基于多尺度分解的信号分离算法下小波基的选取问题进行了研究。首先,搭建了基于多尺度分解的信号分离算法的模型,通过对该算
学位
茶文化由国人的饮茶之习发展而来,禅文化则由印度禅佛教在中国的本土化发展而成,禅茶文化借助饮茶来拉近禅与人们的心理距离,提出参禅如饮茶,由此延伸出“禅茶一味”的思想和审美情趣。本文以“禅茶一味”的审美视角探究首饰的艺术表达,关注中国传统文化下的造物美学、禅茶联姻的文化现象及“禅茶一味”审美情趣的形成,回顾现代首饰的形态发展和设计规律,找寻禅茶文化与现代首饰设计间的关联。探索在多重问题暴露的社会环境中
学位
近年来深度神经网络模型已经成为人工智能领域的研究热点,包括了语音识别、图像理解、视频检测等方面的应用,但是随着神经网络的不断发展,后续的研究对神经网络在精度与速度方面的要求也越来越高,也使得网络模型的结构越来越复杂,参数越来越多,对应用场景与应用设备的要求也越来越高。于是,模型压缩概念方法被提出,模型压缩旨在保持网络的精度的同时,减少网络模型的参数量,从而减小模型的大小,提高网络的推理速度,使得网
学位
近几十年来,随着综合国力的不断提升,我国在航空领域取得了较为突出的成就,空中飞行器的种类和数量都在不断增长,但与此同时如无人机“黑飞”、滥飞”等事件也时有发生,给我们的生活带来各种安全隐患。从大量图像数据中对这些空中目标进行自动部位识别能够方便相关人员对空域进行的活动实行有效的监管,优化空域管理,减少人力成本,提高工作效率。本文基于语义分割对空中目标部位识别算法进行了研究,主要工作如下:(1)构建
学位
神经机器翻译是将一种语言的文本翻译成另一种语言的同义文本的任务,是自然语言处理的一个十分热门研究方向。如今,神经机器翻译在越来越国际化的社会起着至关重要的作用,其大都是基于序列到序列框架构建的,该框架包括一个编码器和一个解码器。编码器负责将输入的源序列映射到一个语义空间;解码器根据编码器的结果迭代地预测出目标序列。序列到序列模型的编码器的训练过程和测试过程是相同的,都是将源序列编码到一语义空间,但
学位
互联网的开放性使得用户可以在网上对参与过的活动发表评价,同时也为其他用户提供决策参考。爆炸式增长的信息量使得人工分析变得困难,对这些来自用户的评论进行自动化情感分析,具有较高的理论分析和实际应用价值。方面级情感分析是一种细粒度情感分析任务,基本的任务目的是寻找评价的对象以及对应的情感极性,也因此更具有挑战性。方面级情感分析有许多子任务,其中最基本的是方面词抽取以及方面情感分类。本文从三个方面讨论了
学位
个人所得税是一个极具增长潜力的税种,随着个人所得税收入的扩大、地位的提高,其对调整收入分配和增加财政收入的影响巨大。自2019年修订新《个人所得税法》后我国不仅在法律上改革了个人所得税制度,也逐步将着力点落在了提升个人所得税的征管水平上,但目前个人所得税征收和管理的改革一直落后于税收制度的改革,导致目前的个人所得税制仍然难以全面落实。面对电子商务和信息技术的迅速发展,个人收入来源的差异化和隐蔽性逐
学位
地震反演是将地震资料转化为地下介质岩性和含油气信息的重要技术手段。由于地震数据具有带限特征和噪声干扰影响,导致地震反演存在低分辨率及多解性问题。主要体现在垂向地震道高频和低频部分缺失和横向多道地震数据的不连续性。解决反演分辨率问题最直接的方法就是通过正则化手段加入高频和低频信息进行约束反演,比如通过假设高频信息满足特定数学假设实现对地震数据的频带拓宽。有研究表明,常规特定数学假设不满足实际地层条件
学位
相比于传统的成像方式,基于光场的成像方式在记录场景中光辐射的位置信息的同时,也记录了光辐射的方向信息。光场图像“单曝光多视角,先拍摄后聚焦”特点为被动式深度估计方法打开了新的思路,具有重要的研究意义。然而如何在充分利用四维光场信息的同时,解决光场图像基线窄、遮挡区域深度估计误差大等问题是该研究的重要课题。本文研究的主要工作内容包括:1)提出基于稀疏AD-Census及十字多视点的匹配代价计算方式。
学位