论文部分内容阅读
中医舌象客观化分析中,舌色、苔色和苔厚都可认为是一幅舌象的标记,即舌象为多标记对象。传统的舌象分类都属于单标记学习,无法对多标记对象进行建模。所以本论文在提取舌象颜色特征和纹理特征的基础上,首次探索使用多标记学习方法对舌象进行分类。由于舌象的多个类别标记之间具有一定的相关性,因此本论文利用其相关性选取合适的多标记学习算法,获得了比较好的分类效果。本论文主要工作包括三个部分: 1.对舌象进行苔质分离和特征提取。首先,需要进行舌象苔质分离。本论文采用多通道动态闽值方法进行苔质分离,取得了不错的效果。在HSV颜色空间分别提取舌质和舌苔的5维主色调及其柄。然后,纹理特征提取方面,对舌象的舌苔区域进行分块,用灰度共生矩阵的方法提取每一块的能量、熵、对比度和逆差距4维特征。 2.对舌象进行多标记分类。由于舌象的多个类别标记之间有一定的相关性,在分类的过程中对标记相关性加以考虑,可以提高分类准确率。所以本论文采用以标记集合中不同标记间的相关性为切入点的LEAD算法对舌象进行分类,并选用Hamming loss、Subset accuracy和(6)-Evaluation作为多标记学习的评价指标,将LEAD的分类结果与另外两个多标记算法ML-kNN和Rank-SVM进行比较。实验结果表明,LEAD在三个评价指标上的分类效果都要优于ML-kNN和Rank-SVM。最后将LEAD的分类结果与单标记学习分类器SVM进行比较,实验结果表明LEAD在“淡红舌”和“薄白苔”两个类别上有较高的分类准确率。 3.LEAD算法阈值的确定。LEAD算法预测阶段将隶属度分数大于0.5的标记归为相关标记。但是由于每个类别的分布是不同的,所以为所有的类别设置一个统一的阈值是不合适的。本论文探索用迭代算法为每一个类别设置一个不同的阈值,并且将分类结果和另外一个多标记阈值确定算法DTML的结果进行比较。实验结果表明,迭代算法不仅步骤上较DTML更为简单,而且在Hamming loss、Subset accuracy和a-Evaluation三个评价指标上的分类效果都要优于DTML。 本论文探索将多标记学习用于舌象的分类,能够将舌质颜色、舌苔颜色和舌苔厚度多个类别标签同时赋予一幅舌象,而且选择了能对标记相关性加以有效利用的算法,使得对舌象的描述更全面更准确,可以有效地辅助中医进行舌诊。