论文部分内容阅读
视觉信息是人类重要的信息来源。随着传感、通信、存储技术的飞速发展,人们通过各种设备接收到越来越多的视觉信息。如何充分地处理这些信息是亟待解决的问题。本文通过调研,总结了仿生视觉系统、车牌识别以及图像超分辨率重建的研究现状。以人类视觉机制为指导,提出了几种视觉信息融合算法,分别从数据级、特征级和决策级对视觉信息进行有效的融合,并将其应用于实际的车牌识别(LPR)之中。
本研究主要包括两个方面:⑴提出并实现完整的仿生视觉系统并成功应用于LPR;⑵提出并实现了完整的多源图像超分辨率重建算法。基于仿生的车牌识别(BVLPR)系统模仿人类视觉系统,整个系统采用先检测、后重建、最后识别的思路。首先,基于视觉注意模型的车牌检测(VALPD)算法中,通过融合色彩、亮度和方向等特征,获得图像的显著度映射;以显著度映射为指导,通过Adaboost方法精确检测车牌。其次,针对车牌目标建立字典,通过联合稀疏编码建立目标高低分辨率图像片之间的对应关系,实现面向目标的车牌图像超分辨率,可以使低分辨率字符错误识别率下降24%。最后,采用卷积神经网络(CNN)进行车牌字符识别。CNN将特征提取嵌入到网络结构中,可以实现更准确的车牌字符识别。在950幅实拍车辆图像构成的数据集上的测试结果表明,本文方法在实际车牌检测应用中取得了良好的检测结果,可以从复杂的环境背景中精确检测车牌。VALPD的ROC曲线的线下面积(AUC)达到0.9081,而传统的Adaboost的AUC仅为0.8441。整个BVLPR系统在该数据集上可以获得84%的正确识别率,性能优于传统方法。BVLPR比已经商业化应用的LPR系统具有明显的优势。此外,本文还提出一种多源图像超分辨率重建算法。该算法通过自动的曲率尺度空间特征角点提取和匹配估计亚像素精度的位移信息,通过复合框架充分建模多个图像传感器的系统模型。该算法在仿真和实拍的测试数据上表现出良好的性能,重建图像具有更清晰的细节信息。这些算法在实际测试中表现出良好的性能,充分说明通过视觉信息融合,我们可以更充分、更全面的表示和理解视觉信息。