论文部分内容阅读
聚类分析是数据挖掘的主要内容,K-means算法是常见的聚类算法之一。K-means算法以其思想简单、容易编码实现、收敛速度快等优点而被广泛的应用在许多领域中。然而K-means算法也存在着一些缺陷,因此亟需对K-means算法存在的缺陷进行研究,以便更好的挖掘出高质量的信息。在图像处理中,无论是图像分析,还是进一步的图像语义理解,往往需要对原图进行图像分割,然后对分割得到的不同区域进行特征提取,以供分析理解之用。聚类算法在对彩色图像进行分割时具有效率高、适应性强等优势而受到广泛的关注。本文对聚类分析和彩色图像分割进行了研究。主要工作有:(一)研究了聚类分析和彩色图像分割的主要算法。(二)针对传统K-means算法存在的类簇数目K值难以确定及聚类结果对初始聚类中心敏感的缺陷,提出了一个改进的K-means算法(CNACS-Kmeans)。定义了一种新的计算样本对象局部密度的方法,构造了数据集的决策图,运用回归分析和残差分析的方法从决策图中获取较优的初始聚类中心和类簇数目,然后运用获取的初始聚类中心作为输入参数进行聚类操作,在模拟数据集和UCI真实数据集上的实验结果表明,改进后的算法可以取得较好的聚类结果。(三)针对K-means算法分割彩色图像存在的分割数目难以确定及过分割和错分割的现象,给出了一种基于改进K-means预分割和区域合并的彩色图像分割方法。首先对K-means算法在分割彩色图像时初始中心点的选择策略进行了改进,然后设置一个较大的K值,运用改进后的K-means算法对彩色图像进行初始的分割,接着对初始分割后得到的相邻且相似的区域进行合并操作,当某次合并后图像颜色分散度的变化率超过阈值时就撤销本次合并,生成最终的分割结果。实验结果验证了该分割算法可以取得较好的分割结果。