论文部分内容阅读
随着虚拟现实、无人驾驶和逆向工程等三维应用的不断发展,直接快速有效的处理三维点云数据的研究得到了重视。深度学习的方法在二维图像领域取得了很大的成功,使得很多基于机器学习和深度学的方法能够应用到许多行业领域中。由于三维数据的空间结构性的特点无法直接使用这些成熟的深度学习算法。因此,如何将深度学习的方法应用到三维数据上面也成为了现阶段的研究热门。结合了近些年深度学习在点云分类上的研究成果,以及深度学习模型实时推理的应用需求,引出了本文的研究课题,并且针对点云数据的特点展开了以下几点研究:(1)首先研究介绍了点云数据的特点和常用的数据格式,然后围绕近些年深度卷积网络的发展和深度学习方法的并行化设计的策略,阐述了CUDA流并行化计算的相关技术。(2)研究分析了几个重要的基于深度学习方法的点云分类模型。研究阐述了如何在硬件中设计针对卷积神经运算的并行化优化方法,同时介绍了目前深度学习框架中常用的数据流图设计,以及流图设计的时候能够加速数据的读取和并行化的训练方法。(3)实验分析深度学习框架在单机和分布式集群的训练方式的异同。依据点云的几个模型实验复现网络模型框架。设计分布式训练环境,用于验证多工作节点的可行性。并且在云平台上搭建并行优化网络。在云服务器平台上验证不同数量工作节点情况下模型的训练耗费的时间。(4)结合深度学习分类在终端设备应用,设计能够快速并行化实现三维点云分类方法。首先介绍了目前的硬件支持和软件并行化的概念,阐述了CUDA流编程实现和GPU的事件调度。实验分析了不同三维点采集的情况下,分类模型的精度和速度比较。