移动场景下行人实时检测方法研究及实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jm8888jm8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉领域的不断发展,特别是近年来深度学习取得了突破性进展,人类正逐步迈入智能时代。行人检测技术在机器人、安防监控、无人驾驶等诸多智能领域都有着重要的应用。现有的行人检测算法有两大缺点,一是尽管现有的算法可以达到很高的检测精度,但检测速度慢。二是现有算法的出发点大都建立在科研的基础上,算法运行平台是专门用于科研的高性能计算机,直接将算法应用到实际场景中会面临诸多难题。本文就如何加快行人检测速度展开研究,利用目标候选框算法来减少检测区域,并利用视差来提前排除非行人窗口,同时针对移动场景和嵌入式平台采用多种优化方法降低算法复杂度和空间复杂度。本文的具体研究内容如下:一、针对图像中的行人往往只占整幅图像的一小部分,实际检测过程中检测的大部分区域是非行人区域的缺点,利用目标候选框算法来获得检测区域并在得到的检测区域上检测行人,相比直接从原图中进行检测,所需检测的区域的面积更小。二、针对分类器判别窗口的过程中,判别的大部分窗口是非行人窗口的特点,利用视差来提前排除非行人的窗口,减少了后续需要判别的窗口的个数,加快了分类阶段的速度。三、针对在移动场景中检测行人时,运算平台内存小、运算性能低的特点,研究了多种方法来降低计算复杂度和空间复杂度。为了减少空间复杂度,优化了积分图算法,有效减少了空间复杂度。为了加快多尺度检测过程,本文采用了一种基于再映射的多尺度多窗口检测方法,在融合现有方法优点的情况下,利用再映射的方法实现了只用一个尺度窗口滑动就能得到多个尺度窗口的检测结果。为了消除在视频中检测行人时检测结果抖动的现象,采用一种基于视频的提升检测结果稳定性的优化方法。四、针对算法在DM8168平台运行速度慢的缺点,本文通过充分利用平台资源以及减少算法的计算量,减少了算法的运行时间,实现了在DM8168嵌入式平台上实时检测行人的目的。
其他文献
作为目前流行的视频压缩标准,H.264得到了广泛的应用,它在具有高画面质量的同时还能保持较低的码率。随着集成电路的快速发展,FPGA的性能也越来越强,它的并行运算特点也为视频的
高光谱图像的空间分辨率较低,混合像元普遍存在于高光谱图像中,这严重影响了地物的识别和分类精度。光谱解混是一种获得混合像元中的地物种类及丰度信息的处理技术,传统的光谱解混方法需要事先准确给出构造混合像元的端元光谱,妨碍了光谱解混技术的应用,而目前兴起的盲解混技术则可在缺少准确端元光谱信息的情况下,通过对高光谱数据进行分析,直接获取端元和丰度信息。本文分析并比较了传统的光谱解混和盲解混的优劣,给出了一
回声定位是人类的一项基本认知功能,每个人都有利用回声感知周围环境的潜能。研究人类回声定位,不仅可以让人们对自身这一基本认知能力有更清楚的认识,还可以提出一类新的面
TD-LTE-Advanced是中国提出的拥有自主知识产权的4G移动通信标准,该标准已经被国际电信联盟认可并且即将在国内展开部署。为了满足日益增强的移动通信的频谱效率、传输速率等
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种能够实现全天时、全天候二维高分辨率成像的雷达,在军事和民用领域都得到了广泛的应用。在军事侦查中,当军事目标被微波难
米波雷达的波长较长,在反隐身和反辐射导弹方面具有天然的优势。由于受到天线尺寸的限制,米波雷达具有波束较宽、角度分辨力较差等显著缺点,特别是在俯仰维波束打地时,由于受地
MIMO是实现LTE和LTE-Advanced性能目标的物理层关键技术之一。有三种基本的MIMO技术:空间分集、空间复用和波束成形。本文主要研究基于预编码的空间复用和基于预编码的波束成
随着多媒体技术的高速发展,数字视频的应用范围越来越广泛,不仅丰富了人们的日常生活,而且在航空航天等高科技领域也发挥着越来越重要的作用,因此针对不同的应用环境设计具有特定
学位
孪生支持向量机(TWSVM)摒弃了传统SVM平行约束的条件,通过求解两个形如SVM的二次规划问题来获得分类模型,可以将训练时间缩短到原SVM的1/4。然而,原始TWSVM并没有考虑到数据的