论文部分内容阅读
随着互联网的发展,图像和视频帧数据呈现爆炸式增长。虽然图像和视频数据的规模庞大,但是这些数据同时也具有极高的冗余性,这为高效的分析数据内部结构、解决半监督分类和索引算法面临的时间复杂度高问题提供了新的解决思路。 本文的研究思路是首先利用稀疏表达对图像和视频帧数据建立离散稀疏建模,并提出离散字典学习算法选择出具有代表性的样本子集。在该样本子集上我们提出一种利用稀疏矩阵乘法分析数据流形结构、利用结构化稀疏表达分析数据聚类结构的一种高效的数据内部结构分析方法,利用该方法我们提出一种时间复杂度低的半监督分类算法,从而解决大规模数据半监督分类的效率问题。应用这种高效的数据内部结构分析方法,我们提出满足熵最大化条件的拟合谱哈希,该算法可在解决谱哈希算法编码低效问题的同时提高二进制编码索引的准确性。本文的研究工作主要包括以下三个部分。 1.基于稀疏表达的代表性图像选择 在处理多媒体内容分析的应用时,提取少量的样本代替数据集合进行模型训练可有效的降低内存及时间开销。现有代表性样本选择算法能够从整个数据集合中选择出满足不同假设条件的特定数据子集,然而这类算法并不能保证选择出来的数据子集能够覆盖整个数据集合的分布。针对这个问题,我们提出了基于离散稀疏模型的样本选择方法,该方法通过最小化样本子集与数据集合之间的KL距离,能够得到覆盖数据集合的最优样本子集;同时我们提出的方法解决了传统方法只关注高密度区域,忽视中、低密度数据区域的问题,并且能够在线性时间复杂度内高效选择出的样本子集。 2.基于稀疏表达的半监督图像分类 针对多媒体大数据中存在标注信息缺失、而人工标注费时费力的问题,现有研究提出利用无标注数据同有标注数据一起学习更好模型的半监督学习方法,其中基于图的半监督学习方法是一类应用广泛的方法。然而现有基于图的半监督学习方法面临着不满足聚类假设和时间复杂度高的问题。我们提出了基于稀疏表达的半监督学习方法,该方法在样本子集上利用稀疏矩阵乘法分析数据的流形结构、利用结构化稀疏表达分析数据的聚类结构,通过对数据的内部几何结构进行学习以充分利用未标注数据来提高模型的分类准确率,这种在样本子集上分析数据内部结构的方法可大幅降低半监督模型的计算时间复杂度,从而能解决大规模数据半监督学习的效率问题。 3.基于稀疏表达的二进制哈希技术 针对大规模媒体数据检索中数据存储和快速检索两大问题,现有研究工作提出二进制哈希算法。二进制哈希算法将数据编码为二进制码以实现数据的高效存储和检索,其中谱哈希是一种经典的基于图的二进制哈希算法,该方法假设数据取样于多维度的均匀分布,然而均匀假设并不适用于实际应用中的数据。我们提出了拟合谱哈希算法,该算法首先应用基于稀疏表达的数据内部结构分析方法提升谱哈希算法的检索准确率,然后利用Sigmoid函数拟合数据以使其能够近似的服从均匀分布,最后使用一维拉普拉斯特征函数计算二进制编码。提出算法在提升谱哈希算法检索MAP的同时可大幅度提高其二进制编码的熵值。与现有常用的二进制编码方法相比,提出方法在检索性能上可媲美这些方法,同时提出方法的时间开销则低于这些方法。