遮挡条件下基于人体部位的行人检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xq_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能时代的到来,各行各业都掀起了一股人工智能的浪潮。行人检测(Pedestrian Detection)是计算机视觉领域一个重要的研究方向,其作为自动驾驶、智能监控和人机交互系统等中的关键技术,一直备受学术界和工业界的关注。目前大多数行人检测算法在场景单一、行人较稀疏的场景能够有很好的检测效果,但是随着遮挡程度的加深,行人检测效果急剧下降。针对这一问题,本文以部分遮挡情况下的行人作为主要研究对象,给出了一种基于人体部位的行人检测方法,并开展相关实验研究。本文基于候选区域检测的网络结构,结合遮挡情况下人体可见区域的分布,给出了一种基于人体部位的行人检测方法。针对行人外形姿态的特殊性,本文在通用目标检测网络的基础上设计出对人体结构有更高适应性的检测网络。通过对数据集中遮挡行人的可见区域分布进行分析,本文提出了一种按遮挡程度对行人部位进行不同层级划分的方法。可见区域越小其层级越低,高层可见区域由多个低层可见区域组成。根据人体部位划分的结果,设计出一种多感受野的行人部位检测网络,采用多尺度的卷积操作有效地提取出不同层级部位的特征信息。在对每个部位进行可见性估计时,本文提出了对同一部位区域采用“多层检测,相互验证”的方法,通过神经网络的反向传播算法对部位的可见性估计进行修正,有效减小了行人检测的漏检率。在部位检测算法的基础上,为了进一步减小遮挡对检测效果的影响,本文对网络结构和损失函数进行了优化。为了获得更具有代表性的特征,本文设计了两种注意力机制网络,使模型能够更加关注感兴趣的区域。针对行人间的相互遮挡,本文设计了一种带惩罚项的损失函数,有效削弱了预测框朝向非目标边界框偏移对检测效果造成的影响。本文将给出的模型在Caltech行人数据集的三个测试子集下对检测结果进行评估,分别计算其MR-FPPI曲线值,在Reasonable子集上的漏检率为12.73%,Partial occlusion子集上的漏检率为18.89%,Heavy occlusion子集上的漏检率为54.68%。通过与其他算法的对比实验以及自对比实验,本文算法在Partial occlusion子集上漏检率减小了1.1%,在Heavy occlusion子集上漏检率减小了6%,说明本文提出的网络模型能够更好地处理行人检测中的遮挡问题。
其他文献
本文的翻译材料是将在泰州溱湖景区拍照收集到的所有文字信息转录而成的旅游文本。此文本涉及大量旅游信息,包括景区相关的实用信息,文化信息,以及旅游景点的介绍词,要求笔者使用合理的理论框架和恰当的翻译策略,使译文能够让目的语读者读懂。目的论认为,翻译是一种有目的的行为,因此在翻译过程中所采用的翻译策略也需由翻译目的决定,了解译文的功能以及翻译源文本的目的是目的论对翻译工作者提出的重点要求。由此意味着在目
软件定义网络(Software Defined Network,SDN)是一种新型开放式的分层型架构,打破了传统网络的垂直架构,并实现了网络的可编程,从而提高了网络的灵活性和可控性。早期的SDN实现方式依赖于单个控制器,然而随着SDN在不同规模网络中的推广与应用,单控制器面临着性能不足、单点失效、可扩展性差等问题。分布式多控制器部署模式是解决该问题的有效途径之一,但如何对多控制器进行合理的部署则是
科技的发展推动着社会进入智慧时代,治理主体趋于多元化,治理模式也将发生变革,政府治理方式与治理能力同时面临着机遇和挑战。利用信息进行治理是政府治理能力提升的必然选择,但个人信息保护也是时代发展公民不断上升的权利需求,二者之间产生了一定的冲突。政府利用信息的治理行为类型复杂、收集利用信息的方式不规范及问责机制的不完备是二者冲突的主要原因。但矛盾产生的根本在于信息权这一理论的发展使得国家治理中信息公开
本论文对硅酸盐Ce9.33(SiO4)602、Ce9.33-xTbx(SiO4)6O2晶体与硼酸盐EuxBa1_xB204晶体的原料合成、晶体生长、磁性、光学与磁光性能等方面进行了较为系统的研究。通过高温固
近年来,作为能够有效帮助法官提高工作效率、切实简化司法流程的自动化法律判决预测成为司法人工智能的重要研究方向。自动化法律判决预测旨在将自然语言处理技术应用于司法数据,根据输入案件的案情描述,自动预测被告人的罪名、刑期以及与本案相关的法条和类似案件等。不仅能为司法工作人员提供专业的法律建议,也能为非专业但有需要的人士提供高效廉价的法律咨询服务。关于自动化法律判决预测,以往多数研究不考虑任务之间的内在
钛及钛合金具有良好的化学耐腐蚀性及良好的生物相容性,较低的弹性模量,较高的比强度,引起了较多学者的关注,在医疗骨替换及牙齿等方面具有广泛的前景。钛在自然界的丰度比较高,但因其比较活泼,冶炼加工成本比较高,限制了它的使用。粉末冶金法是获得低成本钛的有效方法。钛在医疗领域用作骨替换材料,但钛及钛合金材料相比骨的弹性模量及抗压强度较高,力学性能不匹配,易造成应力屏蔽从而使植入失效。降低钛的弹性模量使力学
回音壁模式(WGM)光学微腔是一种具有超高品质因子和腔模模式体积极小的新型光学微腔,其具有极高功率密度的WGM可以显著地增强光与物质的相互作用。基于WGM微腔的光学频率梳(O
传递签名是一种能够高效解决图状大数据认证问题的特殊数字签名,在管理域、军事指挥系统、PKI证书链以及电子政务中都具有实际应用价值。传递签名方案中,已知相邻两条边(i,j)
随着视频网站的快速发展,我国互联网视频产业逐渐走向成熟,网络自制节目开始向精致化、品质化和专业化转变。与之前成本低下内容粗糙的网络自制节目相比,随后涌现的优秀节目
微球谐振腔中的耳语回廊模(Whispering gallery mode,WGM)有着模式体积特别小和品质因子特别高(Q=1010)的特点,使得由WGM作为泵浦光场时其功率密度极高(GW/cm2),损耗很小,产