基于SSD-Mobilenet网络和RGB-D相机的工件检测与定位系统研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:liongliong570
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,深度学习以及工业自动化技术的飞速发展使机器视觉在现代工业生产中被广泛应用。机器视觉可以获取场景内物体的各种信息,增强机器人对于周围环境的感知能力和对突变情况的反应能力,大大提高生产的效率。针对工业生产线上的工件实时检测与定位问题,本文提出了基于深度学习技术和双目IR结构光深度相机相结合的工件检测和定位方法,可以实现对目标工件的实时类别检测和三维坐标获取。论文将围绕目标检测算法、RGB-D深度相机以及三维视觉测量进行研究。随着深度学习的迅速发展和逐渐成熟,使用深度学习算法来解决目标检测问题是当下的主流。基于神经网络的各种目标检测算法接连问世,并且经过不断完善和改进在标准数据集上显示出了更好的性能。本文搭建了Google的Tensor Flow Object_detection API架构,采用SSD与Mobilenet网络相结合的SSD-Mobilenet网络实现对相机捕获的视频流中工件的实时检测。SSD网络将YOLO的回归理念和Faster RCNN的Anchor机制相结合,既保证了检测的速度,也达到了很高的准确度。Mobilenet模型是一种专门为嵌入式移动设备设计的轻量级模型,同时具备了低延迟和高精度的两种特性。SSD网络和Mobilenet网络相结合能实现速度快,检测帧率高,置信度高,达到实时精确的目的。在三维视觉的深度获取上,最为常见的方法是采用纯双目、结构光或TOF的深度相机。双目立体视觉通过左右相机获取不同角度的图片并计算左右图像的视差,再根据相机投影模型获取目标物体的三维坐标。但在实际应用场景中,这种方法受光照强度和角度影响很大,对于缺乏视觉纹理特征的场景匹配很困难,匹配的精度和正确性也很难保证。结构光测量技术通过投影结构光的方式增加了被测物体的纹理信息,提高了测量精度,但缺点是在强烈自然光环境下效果不好。TOF技术原理是通过向目标物体打光,测量光在镜头和物体之间传输时间来实现测距,测量范围大、精度高但技术不成熟且成本要求高。通过对三种深度相机的对比,本文采用了基于主动红外立体声技术的Intel Realsense D435i来实现三维坐标的获取。该相机基于三角测量的原理,通过左右红外传感器和红外投射器投射结构光来测量深度,最后根据标定的相机参数获取目标对象的三维坐标。这种方法能有效解决场景光线强弱和视觉特征对实验结果的影响,提供复杂场景下实时准确的景深计算。本文基于Intel Realsense D435i相机搭建了实时工件检测和三维距离测量系统,搭建Tensorflow深度学习框架并实现了基于SSD-Mobilenet的目标检测算法,最终在检测得到的图像区域上完成工件中心的三维空间点测量。最终一系列实验结果表明,本文设计实现的工件实时检测与定位系统能够对静止和运动中的工件都具有良好的实时检测与定位效果,所采用的思路和方法是合理可行的。
其他文献
近年来,我国社会已经逐步步入老龄化社会,老年人口所占比重逐年增加,老年人的健康与否将影响到我国社会的和谐稳定,因此,有必要加强对老年人各方面的重视。但纵观我国各大省
水稻追肥作业在整个水稻生长季中通常需要进行2次以上,目前在水稻的机械追肥作业中以离心圆盘式撒肥机为主,该方式在作业幅宽方向上的撒施均匀性不稳定,且难以实现作业幅宽方
新三板市场作为我国资本市场不可分割的一部分,相对主板来说,其挂牌条件较为宽松、审批程序有所简化、注重加强信息披露,是我国打造多层次资本市场的一大创举,实务中也发展迅速。尽管成果喜人,但也暴露出诸多问题。基于此,2017年全国中小股份转让公司适时实行了分层制度改革,并同步进行信息披露制度改革。经过此次改革,新三板市场整体,尤其是在信息披露方面进入崭新阶段。尽管如此,会计信息披露违规的情况仍时有发生。