论文部分内容阅读
目标检测和识别是计算机视觉、模式识别与机器学习领域非常活跃的研究方向,在安防、交通、互联网等很多领域得到广泛应用。虽然近年来目标检测和目标识别算法的研究已经取得了较大进展,但可以同时兼顾实时性和准确性的目标检测和识别应用方面的研究工作仍非常有限。本文对基于FPGA和DSP的目标检测和识别方法进行了比较深入的研究,解决了多个关键技术问题,为研制开发具有实用价值的嵌入式目标检测和识别系统打下了良好基础。 本文的主要工作如下: 1、针对红外图像中行人目标的特点,提出了一种基于贝叶斯概率分布的红外小行人目标检测方法,并在课题组设计的基于FPGA和DSP的嵌入式智能图像处理卡上进行了实现。 针对远距离拍摄的红外小行人目标轮廓不清楚、形状差异大的问题,通过增加45度和135度两个方向的边缘提取算子,以及改进边缘提取的条件,提高了Sobel算子边缘提取的性能,进而提高了目标检测的精度;将目标的每一个位置的像素值作为一个特征属性进行计算,基于朴素贝叶斯方法进行参数的训练,解决目标较小且没有局部特征的问题。 将算法的主要部分包括图像滤波、边缘检测及行人目标的检测放在FPGA中实现,将相近位置行人目标的合并等后期处理部分放在DSP实现,提高了算法的实时性。FPGA实现高斯滤波时采用一维滤波模板代替二维滤波模板的方式通过对滤波顺序的处理以及定点数计算、对称组先相加再相乘等方式达到节约硬件资源的目的。FPGA实现Sobel边缘提取和行人检测模块时,使用了基于RAM缓存器的方式对流水线上读取的数据进行缓存处理,并给出了Setup时间不足时的解决方案。针对FPGA中需要同时对多个模块的并行处理结果存到外部SRAM中遇到冲突的问题,使用了包括8个master的wishbone总线,设计优先级级别,基于FIFO采用轮流的方式实现对SRAM的写操作。硬件实现的实验结果表明,本文所提方法可以实现对红外图像中各种姿态行人小目标的实时检测,并且具有很高的正确检测率。 2、针对红外图像中的微小目标的特点,提出了一种基于运动信息的红外微小运动目标实时检测方法,并在课题组设计的基于FPGA和DSP的嵌入式智能图像处理卡上实现。 该方法包括两个步骤:基于单帧图像提取疑似目标和图像序列检测真实目标。在疑似目标的提取阶段,提出用区域对比度和区域灰度自适应阈值方法代替常用的全局自适应阈值法对图像进行二值化,解决了当实际拍摄到的图像亮度不均匀、不同位置对比度差距大时提取到的疑似目标太多或者真实目标被掩盖的问题。 FPGA实现了图像预处理、疑似目标的提取过程。在硬件实现该过程时,针对奇偶场数据分开的PAL制式的视频图像,本文给出了使用二维模板在FPGA中完成形态学操作的设计方案以及基于两个缓存器实现自适应阈值分割操作的设计方案。连通域分析提取疑似目标的特征以及基于图像序列检测真实目标的部分是由DSP实现的。在硬件实现时,为了节约内存,提高处理速度,设计了一种环形指针缓存结构,通过三个整数型的指针参数实现对目标和图像在整个图像序列中的索引;此外,基于目标实际运动速度和面积尺寸变化的约束,提出了一种快速匹配方法,可以迅速为当前帧内的目标搜索其在前一帧中的匹配目标。最后本文所提方法的有效性和实时性通过两个实验得到了验证。 3、为了满足目标识别的实时性需要,提出了基于降维SIFT特征描述向量的目标识别算法,通过FPGA和DSP实现了SIFT特征描述向量的快速提取,并通过基于FPGA和DSP的智能图像卡验证了所提出的方法的有效性和实时性。 首先将SIFT特征点的提取过程完全在FPGA中进行了流水线实现,然后将特征描述向量由128维改进为72维,采用DSP调用FPGA的方式实现,最后在目标识别时提出了一种改进的近似近邻搜索算法寻找最佳匹配点,同时采用三种措施减少误匹配,确保匹配的正确率。实验一用71个模型建立数据库,实现了对这些目标在各种变化场景下的实时识别,验证了所改进的算法的有效性。由于在实验过程中发现计算一个目标的所有72维的特征描述向量的过程仍然非常耗时,因此,本文又基于FPGA的特点,提出了一种新的18维SIFT特征描述向量和该特征描述向量的快速计算方法。该特征描述向量99%的计算过程与SIFT特征点提取过程可以在FPGA中通过三条流水线同步实现,将特征描述向量的提取速度提高了约7.7倍,并使识别一个目标的时间由原来的200毫秒左右缩短为45毫秒左右,可以很好地满足多数高速运动视觉系统的实时性需要。新算法的有效性也通过室内的场景识别实验得到了验证。