论文部分内容阅读
随着全球数据量爆炸式的增长,如何能够快速高效地对数据进行处理和分析变得尤为重要。在这样的背景下,压缩感知理论一经提出,便引起了学术界和工业界的广泛关注,而其中稀疏表示模型是压缩感知取得成功必不可少的先决条件。稀疏表示模型在给定的过完备字典(构成数据空间的基元素个数比维数大)中用尽可能少的原子来表示数据,由于其对数据简洁高效的表示方式大大降低了对于内存等硬件的要求,因此被广泛应用于图像处理(如图像编码、超分辨率重构、图像修复)、音频处理(如盲源分离、音频增强、音频压缩)、模式识别(如人脸识别、手势识别、表情识别)等领域。尽管如此,稀疏表示方法仍不能完全满足实际应用的需求,究其原因主要有两点:一是大规模问题的适用性不高,比如超大矩阵线性方程组的求解;另一个是模型的鲁棒性不高,即对不同特性数据的处理能力不足,如噪声数据。前者可以通过增加计算资源来解决,而如何提升模型的鲁棒性目前仍存在较大的困难,其原因主要在于现有稀疏表示方法存在以下几个问题:重构数据时选择样本的不稳定性,使用?1范数过于强调稀疏的局限性,对于训练样本数量和质量的过高要求,对非线性结构数据表示能力的缺乏以及对数据特征信息的利用不足等。
基于这些问题,本文从稀疏重构算法和字典表示方法两方面入手,系统开展稀疏表示分类模型的鲁棒性研究,提出4种增强模型鲁棒性的方法,本文的主要研究工作总结如下:
(1)提出一种基于自步学习的加权稀疏表示方法。该方法从表示字典中有效剔除与待测样本相差较大的训练样本,并利用加权手段考虑样本间的局部信息,使稀疏表示成为一种循序渐进的过程,从而有效避免利用相差较大的训练样本表示待测样本,提高分类精度和稳定性。
(2)提出一种基于非凸优化的自适应稀疏稠密混合表示方法。该方法用非凸优化方法将训练字典分解为类别字典和非类别字典,以增强字典的表示能力,同时可克服一般稀疏表示模型对于训练样本数量充足和质量高的限制。另外,在类别字典中利用迹范数代替?1范数,避免过于强调类别字典中的稀疏信息而忽略其相关信息,从而可以根据类别字典结构自适应地选择表示样本,提高模型表示能力。
(3)提出一种基于自适应的核稀疏表示方法。该方法将原始特征空间的数据映射到高维特征空间,并在高维空间利用迹范数对字典结构的自适应性获得更具判别力的训练样本表示待测样本。所提方法结合迹范数与核映射技术,不仅可以有效弥补稀疏表示方法处理非线性结构数据的不足,还能增强模型表示能力,从而可以处理更为普遍的模式识别问题。
(4)提出一种基于自编码的弹性网方法。该方法充分利用数据特征信息,将弹性网模型和自编码器相结合,在编码器和解码器之间添加了弹性网编码模型,用于表示待测试样本,同时通过自编码原理对表示系数进行编码,既借鉴了卷积网络强大的特征提取能力,又利用了弹性网络在表示系数求解上的优势,并设计了一种端到端的训练框架,大幅提升了稀疏表示方法对图像数据的分类能力。
本文研究工作围绕着稀疏表示模型的鲁棒性增强问题,从稀疏重构和字典构造两方面入手,提出了相应的算法,以提升模型处理更多不同特性数据的能力。取得的研究成果不仅丰富了稀疏表示领域的理论研究,而且可进一步提高其解决实际应用问题的能力。
基于这些问题,本文从稀疏重构算法和字典表示方法两方面入手,系统开展稀疏表示分类模型的鲁棒性研究,提出4种增强模型鲁棒性的方法,本文的主要研究工作总结如下:
(1)提出一种基于自步学习的加权稀疏表示方法。该方法从表示字典中有效剔除与待测样本相差较大的训练样本,并利用加权手段考虑样本间的局部信息,使稀疏表示成为一种循序渐进的过程,从而有效避免利用相差较大的训练样本表示待测样本,提高分类精度和稳定性。
(2)提出一种基于非凸优化的自适应稀疏稠密混合表示方法。该方法用非凸优化方法将训练字典分解为类别字典和非类别字典,以增强字典的表示能力,同时可克服一般稀疏表示模型对于训练样本数量充足和质量高的限制。另外,在类别字典中利用迹范数代替?1范数,避免过于强调类别字典中的稀疏信息而忽略其相关信息,从而可以根据类别字典结构自适应地选择表示样本,提高模型表示能力。
(3)提出一种基于自适应的核稀疏表示方法。该方法将原始特征空间的数据映射到高维特征空间,并在高维空间利用迹范数对字典结构的自适应性获得更具判别力的训练样本表示待测样本。所提方法结合迹范数与核映射技术,不仅可以有效弥补稀疏表示方法处理非线性结构数据的不足,还能增强模型表示能力,从而可以处理更为普遍的模式识别问题。
(4)提出一种基于自编码的弹性网方法。该方法充分利用数据特征信息,将弹性网模型和自编码器相结合,在编码器和解码器之间添加了弹性网编码模型,用于表示待测试样本,同时通过自编码原理对表示系数进行编码,既借鉴了卷积网络强大的特征提取能力,又利用了弹性网络在表示系数求解上的优势,并设计了一种端到端的训练框架,大幅提升了稀疏表示方法对图像数据的分类能力。
本文研究工作围绕着稀疏表示模型的鲁棒性增强问题,从稀疏重构和字典构造两方面入手,提出了相应的算法,以提升模型处理更多不同特性数据的能力。取得的研究成果不仅丰富了稀疏表示领域的理论研究,而且可进一步提高其解决实际应用问题的能力。