论文部分内容阅读
随着信息技术的不断发展,基于视觉图像的行人检测识别技术应用越来越广泛。行人检测中的关键问题如分类、识别的核心困难在于特征描述及特征提取。良好的特征描述能降低系统对分类算法的要求,提升行人检测和识别算法的精度与稳定性。因此,特征提取技术一直是该领域的研究热点。 研究人员就不同视觉分类问题提出多种特征提取方法,但随着视觉任务复杂性的增强,人工设计特征提取技术过程日益复杂,且已无法获得理想检测效果。加之,随着视觉任务数据规模的增大以及数据维数的不断增长,张量成为高维数据的主要表达方式。但张量特征提取存在特征间冗余信息多,相关性强等问题,很大程度上影响了张量分类器的性能。 围绕以上问题,本文在对当前特征提取算法分析的基础上,以行人检测和步态识别分类问题为研究对象,开展基于机器学习的行人高效检测识别特征提取技术研究,提出新的特征融合算法、特征学习算法以及张量特征选择算法。主要研究工作和创新成果如下: (1)针对复杂环境下单特征提取算法无法获得理想检测精度问题,提出基于增强学习的特征融合算法。算法以具有互补性的轮廓、颜色、纹理特征为备选特征集,采用相关冗余因子衡量特征间的相关冗余性,进而获得低维度、高辨别率的融合特征。相对传统融合算法来说,可有效降低算法计算复杂度,提升分类器稳定性。为进一步提升分类器性能,提出基于CSD(Canonical SignedDigit Encoding)编码遗传算法联合优化参数算法。该方法通过联合优化分类器参数,获取准确性及泛化能力更强的集成分类器。以ROC(Receiver OperatingCharacteristic Curve)曲线作为评价标准验证算法的有效性,实验结果表明本文算法可有效提升复杂场景下的行人检测精度,降低虚警率。 (2)针对人工设计特征场景适应能力弱、应用设计耗时费力问题,提出基于深度卷积神经网络的特征学习算法。该算法利用浅层学习先验知识提升特征分辨性,采用主成分分析参数初始化方法克服参数随机初始化导致的梯度弥散和早熟问题,采用指数自适应弹性动量参数学习方法提升收敛速度。将该模型应用于文中提出的粗细两级行人检测框架中来验证算法有效性。对比实验表明,本文所提特征学习方法收敛速度快、不易产生早熟现象,在光照差异及梯度干扰背景下,检测精度更高,鲁棒性更强。算法检测速度较传统深度卷积模型提升20%以上。 (3) PCANET(Principal Component Analysis Network)是一种简单而有效的深度模型,它具有参数少、无需参数调整技巧、无需迭代求解等优点。但PCANET在特征提取时,存在破坏数据内在结构,易产生维数灾难,易忽略局部信息,未利用标签信息等问题。针对以上问题,基于张量滤波思想分别提出加权稀疏分块LP-2DPCA深度模型和核岭回归深度模型。该类模型保留了数据的结构特性和关联特性,解决了维数灾难问题。加权稀疏分块LP-2DPCA深度模型采用加权分块算法,提取图像重要局部信息,削弱局部变化对整体特征的影响;采用LP范数约束获得特征向量的稀疏表示,提高算法鲁棒性。核岭回归深度模型利用标签信息降低样本集数量要求,提升特征分辨率。实验证明,较之经典特征提取算法,本文算法在复杂背景下可有效提升检测精度,核岭回归深度模型只需少量样本训练即可获得较好检测效果,且对遮挡、旋转变形目标具有较好的鲁棒性。 (4)针对张量特征间冗余信息和分类器参数影响算法分类性能问题,提出基于Filter-Wrapper混合模型的张量特征选择算法。该算法通过张量CP分解获取低维张量特征,采用二值微粒群算法融合过滤和封装模型,通过联合搜索分类器参数和最优特征子集提升分类器性能。基于USF步态张量集的仿真实验证明,与普通张量分类算法和GA-TFS算法相比,本文算法可明显缩短大规模数据分类时间,平均降低耗时22.06%,并可在一定程度上提高分类精度。