基于FPGA和DSP的目标实时检测和识别方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:qinzhenxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测和识别是计算机视觉、模式识别与机器学习领域非常活跃的研究方向,在安防、交通、互联网等很多领域得到广泛应用。虽然近年来目标检测和目标识别算法的研究已经取得了较大进展,但可以同时兼顾实时性和准确性的目标检测和识别应用方面的研究工作仍非常有限。本文对基于FPGA和DSP的目标检测和识别方法进行了比较深入的研究,解决了多个关键技术问题,为研制开发具有实用价值的嵌入式目标检测和识别系统打下了良好基础。  本文的主要工作如下:  1、针对红外图像中行人目标的特点,提出了一种基于贝叶斯概率分布的红外小行人目标检测方法,并在课题组设计的基于FPGA和DSP的嵌入式智能图像处理卡上进行了实现。  针对远距离拍摄的红外小行人目标轮廓不清楚、形状差异大的问题,通过增加45度和135度两个方向的边缘提取算子,以及改进边缘提取的条件,提高了Sobel算子边缘提取的性能,进而提高了目标检测的精度;将目标的每一个位置的像素值作为一个特征属性进行计算,基于朴素贝叶斯方法进行参数的训练,解决目标较小且没有局部特征的问题。  将算法的主要部分包括图像滤波、边缘检测及行人目标的检测放在FPGA中实现,将相近位置行人目标的合并等后期处理部分放在DSP实现,提高了算法的实时性。FPGA实现高斯滤波时采用一维滤波模板代替二维滤波模板的方式通过对滤波顺序的处理以及定点数计算、对称组先相加再相乘等方式达到节约硬件资源的目的。FPGA实现Sobel边缘提取和行人检测模块时,使用了基于RAM缓存器的方式对流水线上读取的数据进行缓存处理,并给出了Setup时间不足时的解决方案。针对FPGA中需要同时对多个模块的并行处理结果存到外部SRAM中遇到冲突的问题,使用了包括8个master的wishbone总线,设计优先级级别,基于FIFO采用轮流的方式实现对SRAM的写操作。硬件实现的实验结果表明,本文所提方法可以实现对红外图像中各种姿态行人小目标的实时检测,并且具有很高的正确检测率。  2、针对红外图像中的微小目标的特点,提出了一种基于运动信息的红外微小运动目标实时检测方法,并在课题组设计的基于FPGA和DSP的嵌入式智能图像处理卡上实现。  该方法包括两个步骤:基于单帧图像提取疑似目标和图像序列检测真实目标。在疑似目标的提取阶段,提出用区域对比度和区域灰度自适应阈值方法代替常用的全局自适应阈值法对图像进行二值化,解决了当实际拍摄到的图像亮度不均匀、不同位置对比度差距大时提取到的疑似目标太多或者真实目标被掩盖的问题。  FPGA实现了图像预处理、疑似目标的提取过程。在硬件实现该过程时,针对奇偶场数据分开的PAL制式的视频图像,本文给出了使用二维模板在FPGA中完成形态学操作的设计方案以及基于两个缓存器实现自适应阈值分割操作的设计方案。连通域分析提取疑似目标的特征以及基于图像序列检测真实目标的部分是由DSP实现的。在硬件实现时,为了节约内存,提高处理速度,设计了一种环形指针缓存结构,通过三个整数型的指针参数实现对目标和图像在整个图像序列中的索引;此外,基于目标实际运动速度和面积尺寸变化的约束,提出了一种快速匹配方法,可以迅速为当前帧内的目标搜索其在前一帧中的匹配目标。最后本文所提方法的有效性和实时性通过两个实验得到了验证。  3、为了满足目标识别的实时性需要,提出了基于降维SIFT特征描述向量的目标识别算法,通过FPGA和DSP实现了SIFT特征描述向量的快速提取,并通过基于FPGA和DSP的智能图像卡验证了所提出的方法的有效性和实时性。  首先将SIFT特征点的提取过程完全在FPGA中进行了流水线实现,然后将特征描述向量由128维改进为72维,采用DSP调用FPGA的方式实现,最后在目标识别时提出了一种改进的近似近邻搜索算法寻找最佳匹配点,同时采用三种措施减少误匹配,确保匹配的正确率。实验一用71个模型建立数据库,实现了对这些目标在各种变化场景下的实时识别,验证了所改进的算法的有效性。由于在实验过程中发现计算一个目标的所有72维的特征描述向量的过程仍然非常耗时,因此,本文又基于FPGA的特点,提出了一种新的18维SIFT特征描述向量和该特征描述向量的快速计算方法。该特征描述向量99%的计算过程与SIFT特征点提取过程可以在FPGA中通过三条流水线同步实现,将特征描述向量的提取速度提高了约7.7倍,并使识别一个目标的时间由原来的200毫秒左右缩短为45毫秒左右,可以很好地满足多数高速运动视觉系统的实时性需要。新算法的有效性也通过室内的场景识别实验得到了验证。
其他文献
时滞系统状态反馈预测控制(Time-DelayDependentStateFeedbackPredictiveControl--DDSFPC)是针对具有状态滞后、控制作用滞后及可测干扰的离散时间系统,提出的一种改进的状态
本课题研究内容为RUSKAPVT2370控制系统改造的一部分,在保留使用原系统设备及传感器的基础上,完成PVT系统测控电路设计、实现系统的运动控制功能并设计基于PC的监控界面。
游梁抽油机具有结构简单和可靠性高的优点。但也有许多缺点,主要表现在系统效率低、冲程短及冲次不可调上。针对游梁抽油机的缺点,一种新型机电一体化抽油机即电机换向抽油机应
开关磁阻电机调速系统是一种新型交流调速系统,有着结构简单、坚固可靠、起动转矩大、起动电流小等优点,同时具有转矩脉动大、噪声大的缺点。其理论研究还不完善,应用也还是起步
本文以国内某大型钢铁企业常规钢种废次品原因分析需求为背景,结合数据挖掘理论,深入研究了质量分析与优化系统的设计与实现。 针对工业生产的应用特点及现有质量分析应用系
纸币图像识别是一种目前应用很广的识别技术,特别是在银行业,纸币识别系统具有广阔的市场前景和发展空间.研究纸币识别系统的关键问题是设计出实时的硬件电路和高效率的识别
从图像中估计人体姿态是计算机视觉领域具有挑战性的问题之一。人体姿态估计的研究对人体跟踪、行为识别和图像高层语义理解等许多其它计算机视觉问题有重要的推动作用,在实际
由于径向基神经网络结构简单,学习速度快,具有优异的函数逼近能力,因此在模式识别、系统辨识、数学建模等方面有着广阔的应用前景。在实际应用中,需要根据给定的样本数据确定径向
油田开发规划是一项复杂的系统工程,为了增加原油产量,降低生产成本,必须制定科学的开发规划方案。 本文采用数学规划的方法来处理油田开发规划问题,考虑了以下四个目标:利润、
近年来,人工神经网络在深度学习的推进下得到了快速发展,在许多领域都获得了优异的性能。然而,传统的神经网络仍然面临着许多问题,如泛化性差、复杂度高、自适应能力弱等。生物智