基于稀疏表达的图像分类与检索关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xiaoyanmeimei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,图像和视频帧数据呈现爆炸式增长。虽然图像和视频数据的规模庞大,但是这些数据同时也具有极高的冗余性,这为高效的分析数据内部结构、解决半监督分类和索引算法面临的时间复杂度高问题提供了新的解决思路。  本文的研究思路是首先利用稀疏表达对图像和视频帧数据建立离散稀疏建模,并提出离散字典学习算法选择出具有代表性的样本子集。在该样本子集上我们提出一种利用稀疏矩阵乘法分析数据流形结构、利用结构化稀疏表达分析数据聚类结构的一种高效的数据内部结构分析方法,利用该方法我们提出一种时间复杂度低的半监督分类算法,从而解决大规模数据半监督分类的效率问题。应用这种高效的数据内部结构分析方法,我们提出满足熵最大化条件的拟合谱哈希,该算法可在解决谱哈希算法编码低效问题的同时提高二进制编码索引的准确性。本文的研究工作主要包括以下三个部分。  1.基于稀疏表达的代表性图像选择  在处理多媒体内容分析的应用时,提取少量的样本代替数据集合进行模型训练可有效的降低内存及时间开销。现有代表性样本选择算法能够从整个数据集合中选择出满足不同假设条件的特定数据子集,然而这类算法并不能保证选择出来的数据子集能够覆盖整个数据集合的分布。针对这个问题,我们提出了基于离散稀疏模型的样本选择方法,该方法通过最小化样本子集与数据集合之间的KL距离,能够得到覆盖数据集合的最优样本子集;同时我们提出的方法解决了传统方法只关注高密度区域,忽视中、低密度数据区域的问题,并且能够在线性时间复杂度内高效选择出的样本子集。  2.基于稀疏表达的半监督图像分类  针对多媒体大数据中存在标注信息缺失、而人工标注费时费力的问题,现有研究提出利用无标注数据同有标注数据一起学习更好模型的半监督学习方法,其中基于图的半监督学习方法是一类应用广泛的方法。然而现有基于图的半监督学习方法面临着不满足聚类假设和时间复杂度高的问题。我们提出了基于稀疏表达的半监督学习方法,该方法在样本子集上利用稀疏矩阵乘法分析数据的流形结构、利用结构化稀疏表达分析数据的聚类结构,通过对数据的内部几何结构进行学习以充分利用未标注数据来提高模型的分类准确率,这种在样本子集上分析数据内部结构的方法可大幅降低半监督模型的计算时间复杂度,从而能解决大规模数据半监督学习的效率问题。  3.基于稀疏表达的二进制哈希技术  针对大规模媒体数据检索中数据存储和快速检索两大问题,现有研究工作提出二进制哈希算法。二进制哈希算法将数据编码为二进制码以实现数据的高效存储和检索,其中谱哈希是一种经典的基于图的二进制哈希算法,该方法假设数据取样于多维度的均匀分布,然而均匀假设并不适用于实际应用中的数据。我们提出了拟合谱哈希算法,该算法首先应用基于稀疏表达的数据内部结构分析方法提升谱哈希算法的检索准确率,然后利用Sigmoid函数拟合数据以使其能够近似的服从均匀分布,最后使用一维拉普拉斯特征函数计算二进制编码。提出算法在提升谱哈希算法检索MAP的同时可大幅度提高其二进制编码的熵值。与现有常用的二进制编码方法相比,提出方法在检索性能上可媲美这些方法,同时提出方法的时间开销则低于这些方法。
其他文献
学位
网络编码的实质是将传输的数据编码分散,通过一定的冗余机制保证了数据的安全性和系统的鲁棒性。现阶段针对网络编码的研究一般都是在理论层面上,将网络编码应用在实际工作中的
学位
随着互联网的持续繁荣及各类新兴互联网应用的崛起,互联网络承载的总数据流量一直在持续增长。根据思科VNI2013年的报告,过去五年间互联网流量增长了4倍,预计五年后的流量将是现
学位
近年来,随着互联网和云计算的快速发展,数据中心已经成为许多在线服务的关键基础设施,如Web搜索、在线零售、广告/推荐系统以及社交网络等。这些服务通常是软实时性的交互式应用
心脏疾病目前仍是威胁人类身体健康的重要疾病之一,心电图的自动诊断是一种很好的辅助医生诊断和治疗心脏疾病的手段,心电信号的研究也是国内外学者的研究热点。本文的研究对
学位
学位
近年来,高速铁路得到了迅猛的发展,由于列车上乘客日益增长的宽带多媒体需求,以及先进的列车控制的需求,在高速铁路这样的高移动性场景下提供宽带无线通信成为了研究的热点问题。