基于卷积神经网络的RGB-D图像物体检测和语义分割

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:diaoyujiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度传感器的普及,对于RGB-D图像的研究逐渐成为计算机视觉领域的一个研究热点。其中,主要研究方向有RGB-D图像的物体检测和语义分割。物体检测是找出图像中物体的位置并且识别出物体类别的过程,在智能监控里面具有重要应用。语义分割是识别图像中每一个像素点类别的过程,是无人机导航和自动驾驶中的一项基础性技术。RGB-D图像包括RGB图像和深度图像信息,目前在有关RGB-D图像物体检测和语义分割的研究中,对RGB图像和深度图像的特征都是分开提取的,而且正确率还不够高,速度不够快,难以达到产业界使用要求。因此,本文对RGB-D图像物体检测和语义分割进行深入研究,具体工作如下:第一,为了能够同时提取RGB图像和深度图像特征,而不是分开提取,本文提出一种将RGB图像和深度图像融合的方案,并将融合后的图像称为HHG图像,该图像能够同时表达RGB图像和深度图像的视觉内容,在执行物体检测任务和语义分割任务时速度也会得到提升。第二,为了提高RGB-D图像物体检测的精确度和速度,本文提出一种借鉴Faster-RCNN思想完成RGB-D图像物体检测的方案。该方案首先将Faster-RCNN的网络结构修正并调整网络参数,然后利用HHG图像重新训练Faster-RCNN网络模型,最后使用该模型完成RGB-D图像的物体检测任务。在检测过程中,提出一种保留候选边框的方案,本文将该方案称为NMS’。NMS’是对传统的非极大值抑制的一种改进方案,它改变候选边框取舍决策机制,将候选边框之间的重叠率和候选边框周围的边框数量作为边框取舍的依据。第三,为了提高RGB-D图像语义分割性能,本文提出一种借鉴FCN思想完成RGB-D图像语义分割的方案。该方案首先将FCN的网络结构进行修正并调整参数,然后利用HHG图像重新训练FCN网络模型,最后使用该模型完成RGB-D图像的语义分割任务。通过与前人实验结果进行比较发现:采用本文RGB-D图像物体检测方案完成的检测正确率比前人最好的检测正确率提高了9.7%,检测速度快了100倍以上;采用本文RGB-D图像语义分割方案完成的分割正确率比前人最好的分割正确率提高了2.3%;相较于不使用NMS’的物体检测方案,使用NMS’方案的正确率有所提高。
其他文献
用于船舶中的一种高频大功率输出变压器在脉冲状态下工作。其工作频率为10kHz。要求变压器铁芯具有低的高频损耗,高动态磁导率,高饱和磁感应强度和低的剩磁比。 本文介绍了一
为研究高强混凝土遭遇火灾后产生的损伤破坏情况,根据红外热像检测原理,对高温作用后的素混凝土和聚丙烯纤维混凝土进行红外检测,并进行了抗压强度试验。通过对试验结果的分
设计了一种以频率/电压转换芯片LM2917为核心的高性能价格比的汽车超速报警系统。分析了系统电路的工作原理,给出系统的印刷电路板图,并测试实际超速报警车速与其设置报警车
本文考查了Fe-Ni-Co-Si-B系、Fe-Ni-Si-B系和Fe78Si8B14非晶态铁磁合金的起始磁导率μi在宽的温度范围内加热和冷却时的变化。考查了加热时磁滞回线的变化。在宽的温度范围内
2016年,雷洋涉嫌嫖娼被拘致死案,引发了舆情对警察执法行为的抗议。发现公众大多质疑警方的执法方式和调查结果,深入追问雷洋死因和涉事警察不当行为。舆论的关键议题有:警察
针对智能电网中的大数据安全和隐私保护问题,梳理了当前智能电网大数据安全与隐私保护关键技术,按照保护隐私的智能电网大数据分析挖掘技术路线,提出一种保护隐私的智能电网
控制环境是实施内部控制的基础。加强和完善企业内部控制,首先应注意控制环境的建设和优化。针对目前我国中小企业内部控制环境存在的内部人控制严重、企业文化建设薄弱、人
为了降低谱聚类采用高斯函数作为相似性度量方式对参数的敏感性,以及能够发现多密度簇的同时降低噪声点的干扰,提出了一种将基于均衡接近度的灰关联分析结合到谱聚类中的新方
中国乡村旅游的性质和特点以及村级基层组织的职责,决定了其在乡村旅游发展中具有难以替代的作用。村级基层组织在乡村旅游发展中履行职能存在种种不足,在此基础上提出加强村
通过对变压器谐波分析,阐述了变压器谐波对变压器和系统的影响以及可能导致的后果。