面向智能车的物体检测与识别

来源 :浙江大学 | 被引量 : 0次 | 上传用户:conanjunn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能车环境下的物体检测与识别是智能交通领域的关键问题。在智能车视觉系统中,行人、车辆和交通标志是三大最重要的视觉对象。尽管行人、车辆的检测和交通标志的识别已被广泛研究,但在智能车环境下,要实现快速、鲁棒地检测与识别仍然十分困难。本文针对智能车系统中行人、车和交通标志的自动检测、识别问题展开研究,提出了新的检测与识别框架,并成功应用于快速行人、车辆检测及鲁棒的多视角交通标志识别。  本文的主要工作和贡献总结如下:  1.提出了稀疏的可变形部件模型的物体检测框架。可变形部件模型(DPM)是物体检测中最为有效的模型之一。然而由于此模型涉及的特征维度过高,它的计算效率校低,难以用于实时的智能车系统中。为了提高检测效率,我们提出用l1范数的隐支持向量机(SVM)算法来学习稀疏的可变形部件模型。与传统的基于l2范数的可变形部件模型相比,由于稀疏可变形部件模型的特征维度低,它能在保持检测性能不下降的同时提高检测效率。  此工作主要有两方面贡献:1)模型上,我们通过在隐SVM中加入l1正则化项提出了l1-LSVM模型,并用它来学习一个稀疏可变形部件模型;2)方法上,提出了一种随机的截断子梯度下降的方法来求解l1-LSVM问题,并证明了该方法的收敛性。  2.提出了基于级联的稀疏可变形部件模型的快速物体检测。我们将提出的稀疏可变形部件模型用于行人及车辆检测上。尽管模型稀疏,但在检测中由于需要借助滑动子窗口的暴力搜索技术,在大尺度图片上的检测时间开销仍然是智能车系统的阻碍。为了进一步提高检测效率,我们将级联技术嵌入到稀疏的可变形部件模型中。结果表明,结合级联技术后,检测用时可降低几十倍。  此工作的贡献有两方面:1)模型上,我们将级联技术嵌入到稀疏可变形部件模型中,构建了级联的稀疏DPM模型;2)应用上,我们将此模型用于行人及不同类型的车辆检测中,检测用时降低了几十倍。  3.提出了弱监督度量与模板学习的物体识别框架。针对智能车识别系统中高效率的要求,我们提出用模板匹配框架进行物体识别。此外,为了提高识别率,我们判别式地学习一个最优的距离度量。同时,考虑到数据中存在噪声,我们采用弱监督的学习过程使可靠性高的样本在训练中贡献更大。因此,我们提出了一种基于弱监督学习的物体识别新框架,并介绍一种基于隐结构化SVM的弱监督度量及模板学习(WSMTL)方法来联合地学习度量、物体模板及一个表征样本的可靠性的权重向量。由于采用模板匹配技术,WSMTL的识别效率相当高。  此工作主要有两方面贡献:1)模型上,提出了一种通过弱监督的度量及模板学习的新框架来进行物体识别,其中最优度量和模板被联合训练;2)方法上,将模型形式化为一个隐结构化SVM问题,并提出了一种交替迭代的方法来求解此模型。  4.提出了基于弱监督度量学习及3D雷达数据的多视角交通标志识别。我们提出从装有激光雷达的车辆进行交通标志识别的新问题。借助于3D雷达点,道路标志对应的多视角2D图像可以很容易地从拍摄图像中检测出来。检测完毕后,标志识别问题被转化为一个多视角目标识别任务。我们采用基于度量学习的模板匹配来解决这个问题,且通过学习拍摄图像和其对应标志模板之间的最优距离度量来提高识别鲁棒性。对于每一个标志,我们通过对其多视角图像的识别结果进行软投票来识别它。我们提出了一种基于隐支持向量机的弱监督度量学习(WSMLR)方法来学习此度量,并建立了一个用来确定图片在训练和软投票中权重的可靠性分类器。  此工作主要有三方面贡献:1)问题上,我们首次提出从激光雷达标志数据进行多视角标志识别的问题;2)框架上,我们采用基于度量学习的模板匹配来进行标志识别。模板匹配的可行性在于基于LIDAR数据,标志样本可与模板对齐得很好;3)方法上,针对多视角目标识别提出了一个弱监督度量学习(WSMLR)算法。我们的方法具有良好的可扩展性和小样本学习能力。
其他文献
龙芯系列处理器是中国科学院计算所自主开发的,基于MIPS指令集的高性能通用CPU。由于指令集的限制,在龙芯处理器上运行的是基于MIPS的Linux操作系统及应用软件。龙芯处理器为了
本论文研究了超深亚微米(VDSM)层次集成电路中的瓦连寄生效应,时间延迟以及串扰噪音等互连特性。文章介绍了双大马士革集成互连结构中的多种互连寄生参数提取技术,并利用多层金
随着网络的迅速发展,搜索引擎成为了人们掌握知识的利器。但目前搜索引擎存在覆盖范围小、精度低、智能程度低和缺乏个性化等缺点,无法面对专业领域高质量的信息检索服务的要
随着数据库和计算机网络技术的广泛应用,许多大型数据都以分布式形式存储在分布的数据库中,如何从分布的数据库中挖掘有价值的知识是一个具有挑战性的研究课题。关联规则挖掘
近年来,视频技术和无线网络技术得到了飞速发展,基于无线环境的视频应用已经融入人们的日常生活当中。与传统的视频应用不同,移动视频应用中存在着信道带宽窄且波动性大、终端的
随着互联网技术的发展,大量的计算机聚合到一个逻辑的服务平台成为可能,由此产生了一个被称为网格(Grid)的新一代网络环境,构思了像电力网一样“即插即用”地从网格中得到包
近年来,随着计算机科学技术的不断发展和推广,网络传输带宽和计算机处理速度的增长,数字视频信息出现了飞速膨胀,越来越多以前靠人力完成的工作都已经被计算机所取代,视频监控技术
学位
随着网格技术和Web服务的不断融合,以服务方式对外提供计算、存储等资源成为网格发展的趋势,并为网格研究指明了广阔的前景。如何科学准确的评价基于Web服务构建的网格系统平台
本体理论属于人工智能的理论范畴,研究特定领域知识的对象分类、对象属性和对象间的关系,为领域知识的描述提供术语。它是语义Web的基础,可以有效地进行知识表示、知识查询或不
学位
Internet的普及和网络技术的飞速发展使人们面临一种网络信息爆炸性增长的现状,基于文本的垂直搜索引擎因其能够在海量信息中对某些特定垂直领域的信息进行快速检索的突出能力
学位