论文部分内容阅读
聚类分析是一种无监督的机器学习方法,可以根据数据集的结构信息挖掘出潜在的模式。聚类算法和聚类有效性指标是聚类分析的重要组成部分,许多经典的聚类算法和聚类有效性指标被提出,并在现实生活中的很多领域得到了广泛的应用。但这些算法和指标都具有一定的局限性,有着各自的适用范围:大多数的聚类算法需要使用者提供先验信息,聚类有效性指标大多依赖于特定的聚类算法,无法实现完全非监督的聚类分析过程。本文在现有研究的基础上,设计了新的聚类算法和聚类有效性指标,并将其应用在电学层析成像领域,主要研究成果如下:
1.基于数据集超体积和超表面积的聚类有效性指标。该指标挖掘数据集占据的超体积、超表面与聚类数之间的关系,提出了一种基于数据集超体积和超表面积的聚类有效性指标。该指标不依赖于特定的聚类算法,且不采用试错法,具有较低的时间复杂度,并且该指标可以处理具有任意分布的带有噪声点的数据集。
2.基于边界点匹配和内点连通性的聚类有效性指标。该指标利用整个数据集与划分后的各个聚类簇的边界点、内点集合之间的匹配关系计算聚类数。该指标不依赖于具体的聚类算法,可以评价来自C-means,FCM和DBSCAN聚类算法的聚类结果,并且不仅可以评价聚类数参数,而且可以对聚类过程中的其他参数进行评价。该指标还可以对聚类算法进行评价,选出最优的聚类算法。
3.基于行变换邻接矩阵幂次更新的聚类算法。该算法充分利用数据集中点对之间的近邻关系,通过构建邻接矩阵并进行幂次更新来挖掘数据集中隐藏的结构特征。并利用行变换对交叠区域的近邻关系进行优化,使得该算法可以应对含有交叠类的数据集。该算法不受数据分布的影响,对不同密度,不同大小,任意形状以及含有交叠类的数据集均具有较好的聚类效果。
4.模糊聚类在电学层析成像中的应用。将模糊聚类算法应用到电学层析成像领域,提出一种基于模糊聚类的电学层析成像优化算法,该算法通过聚类分析将经典的图像重建算法进行融合,并根据数据点呈现的统计特征对伪影数据进行处理,进而减小伪影的影响,提高了图像的重建分辨率。
1.基于数据集超体积和超表面积的聚类有效性指标。该指标挖掘数据集占据的超体积、超表面与聚类数之间的关系,提出了一种基于数据集超体积和超表面积的聚类有效性指标。该指标不依赖于特定的聚类算法,且不采用试错法,具有较低的时间复杂度,并且该指标可以处理具有任意分布的带有噪声点的数据集。
2.基于边界点匹配和内点连通性的聚类有效性指标。该指标利用整个数据集与划分后的各个聚类簇的边界点、内点集合之间的匹配关系计算聚类数。该指标不依赖于具体的聚类算法,可以评价来自C-means,FCM和DBSCAN聚类算法的聚类结果,并且不仅可以评价聚类数参数,而且可以对聚类过程中的其他参数进行评价。该指标还可以对聚类算法进行评价,选出最优的聚类算法。
3.基于行变换邻接矩阵幂次更新的聚类算法。该算法充分利用数据集中点对之间的近邻关系,通过构建邻接矩阵并进行幂次更新来挖掘数据集中隐藏的结构特征。并利用行变换对交叠区域的近邻关系进行优化,使得该算法可以应对含有交叠类的数据集。该算法不受数据分布的影响,对不同密度,不同大小,任意形状以及含有交叠类的数据集均具有较好的聚类效果。
4.模糊聚类在电学层析成像中的应用。将模糊聚类算法应用到电学层析成像领域,提出一种基于模糊聚类的电学层析成像优化算法,该算法通过聚类分析将经典的图像重建算法进行融合,并根据数据点呈现的统计特征对伪影数据进行处理,进而减小伪影的影响,提高了图像的重建分辨率。