论文部分内容阅读
智能车环境下的物体检测与识别是智能交通领域的关键问题。在智能车视觉系统中,行人、车辆和交通标志是三大最重要的视觉对象。尽管行人、车辆的检测和交通标志的识别已被广泛研究,但在智能车环境下,要实现快速、鲁棒地检测与识别仍然十分困难。本文针对智能车系统中行人、车和交通标志的自动检测、识别问题展开研究,提出了新的检测与识别框架,并成功应用于快速行人、车辆检测及鲁棒的多视角交通标志识别。 本文的主要工作和贡献总结如下: 1.提出了稀疏的可变形部件模型的物体检测框架。可变形部件模型(DPM)是物体检测中最为有效的模型之一。然而由于此模型涉及的特征维度过高,它的计算效率校低,难以用于实时的智能车系统中。为了提高检测效率,我们提出用l1范数的隐支持向量机(SVM)算法来学习稀疏的可变形部件模型。与传统的基于l2范数的可变形部件模型相比,由于稀疏可变形部件模型的特征维度低,它能在保持检测性能不下降的同时提高检测效率。 此工作主要有两方面贡献:1)模型上,我们通过在隐SVM中加入l1正则化项提出了l1-LSVM模型,并用它来学习一个稀疏可变形部件模型;2)方法上,提出了一种随机的截断子梯度下降的方法来求解l1-LSVM问题,并证明了该方法的收敛性。 2.提出了基于级联的稀疏可变形部件模型的快速物体检测。我们将提出的稀疏可变形部件模型用于行人及车辆检测上。尽管模型稀疏,但在检测中由于需要借助滑动子窗口的暴力搜索技术,在大尺度图片上的检测时间开销仍然是智能车系统的阻碍。为了进一步提高检测效率,我们将级联技术嵌入到稀疏的可变形部件模型中。结果表明,结合级联技术后,检测用时可降低几十倍。 此工作的贡献有两方面:1)模型上,我们将级联技术嵌入到稀疏可变形部件模型中,构建了级联的稀疏DPM模型;2)应用上,我们将此模型用于行人及不同类型的车辆检测中,检测用时降低了几十倍。 3.提出了弱监督度量与模板学习的物体识别框架。针对智能车识别系统中高效率的要求,我们提出用模板匹配框架进行物体识别。此外,为了提高识别率,我们判别式地学习一个最优的距离度量。同时,考虑到数据中存在噪声,我们采用弱监督的学习过程使可靠性高的样本在训练中贡献更大。因此,我们提出了一种基于弱监督学习的物体识别新框架,并介绍一种基于隐结构化SVM的弱监督度量及模板学习(WSMTL)方法来联合地学习度量、物体模板及一个表征样本的可靠性的权重向量。由于采用模板匹配技术,WSMTL的识别效率相当高。 此工作主要有两方面贡献:1)模型上,提出了一种通过弱监督的度量及模板学习的新框架来进行物体识别,其中最优度量和模板被联合训练;2)方法上,将模型形式化为一个隐结构化SVM问题,并提出了一种交替迭代的方法来求解此模型。 4.提出了基于弱监督度量学习及3D雷达数据的多视角交通标志识别。我们提出从装有激光雷达的车辆进行交通标志识别的新问题。借助于3D雷达点,道路标志对应的多视角2D图像可以很容易地从拍摄图像中检测出来。检测完毕后,标志识别问题被转化为一个多视角目标识别任务。我们采用基于度量学习的模板匹配来解决这个问题,且通过学习拍摄图像和其对应标志模板之间的最优距离度量来提高识别鲁棒性。对于每一个标志,我们通过对其多视角图像的识别结果进行软投票来识别它。我们提出了一种基于隐支持向量机的弱监督度量学习(WSMLR)方法来学习此度量,并建立了一个用来确定图片在训练和软投票中权重的可靠性分类器。 此工作主要有三方面贡献:1)问题上,我们首次提出从激光雷达标志数据进行多视角标志识别的问题;2)框架上,我们采用基于度量学习的模板匹配来进行标志识别。模板匹配的可行性在于基于LIDAR数据,标志样本可与模板对齐得很好;3)方法上,针对多视角目标识别提出了一个弱监督度量学习(WSMLR)算法。我们的方法具有良好的可扩展性和小样本学习能力。