论文部分内容阅读
随着信息时代高速发展,信息数据量呈指数式增长,人们迫切需要高效管理生活和工作中产生的海量数据,如何对数据精准分类成为科学家亟待攻克的难题。为解决该问题,学者们先后提出监督学习框架、多示例学习框架、多标签学习框架和多示例多标签学习框架。由于真实数据包含复杂信息结构和多重信息,因此,多示例多标签学习框架是最适合解决大数据管理问题的方法之一。本文将多示例多标签学习框架应用到数据分类中,对神经网络结构在多示例多标签分类算法上的应用进行研究,本文的主要研究工作与创新如下:(1)研究并分析经典多示例多标签算法框架,主要包括特征包提取SBN算法;忽略示例和标签之间相关性的MIML-BOOST分类算法和MIML-SVM分类算法,与考虑示例和标签之间相关性的M~3MIML分类算法、MIML-KNN分类算法以及MIMLRBF分类算法。结合五种算法评价指标,通过对自然场景图像数据集的分类实验进行算法性能评估,验证考虑示例与标签之间相关性对MIML分类算法的性能影响。(2)设计并实现基于稀疏编码和多层神经网的多示例多标签分类算法(Sparse Coding Instance Based-Neural Network,SCIB-NN)。为了实现SBN示例包特征的自聚类表示,使用基于示例的K-SVD稀疏编码代替人工度量聚类的传统思想;使用多层神经网结构代替经典分类器解决人工度量聚类思想的局限性,实现标签与示例的模式自匹配;通过引入稀疏残差进一步优化小数据集编码效果。结合五项算法指标,通过实验将改进算法与经典多示例多标签分类算法进行评估,验证改进算法的有效性和泛化性。(3)设计并实现基于卷积神经网特征提取和稀疏子空间映射的多示例多标签学习算法(Sparse subspace mapping Instance Based-Neural Network,SSMIB-NN)。为了实现不同尺寸图像的特征包描述,提出使用卷积神经网提取对象特征代替以固定区域提取特征的SBN算法,同时应用多尺度带洞卷积思想,优化特征提取效果。为了优化示例特征自表述效果,引入稀疏子空间映射算法并改进算法目标函数优化子空间映射性能。此外,继续使用稀疏残差降低小数据集训练不足的影响,提升分类器算法的分类精度。结合五项算法指标,通过实验对两种改进算法与经典算法进行比较验证算法有效性和泛化性。