无参数聚类分析及其应用

来源 :天津大学 | 被引量 : 1次 | 上传用户:zdt19880709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种无监督的机器学习方法,可以根据数据集的结构信息挖掘出潜在的模式。聚类算法和聚类有效性指标是聚类分析的重要组成部分,许多经典的聚类算法和聚类有效性指标被提出,并在现实生活中的很多领域得到了广泛的应用。但这些算法和指标都具有一定的局限性,有着各自的适用范围:大多数的聚类算法需要使用者提供先验信息,聚类有效性指标大多依赖于特定的聚类算法,无法实现完全非监督的聚类分析过程。本文在现有研究的基础上,设计了新的聚类算法和聚类有效性指标,并将其应用在电学层析成像领域,主要研究成果如下:
  1.基于数据集超体积和超表面积的聚类有效性指标。该指标挖掘数据集占据的超体积、超表面与聚类数之间的关系,提出了一种基于数据集超体积和超表面积的聚类有效性指标。该指标不依赖于特定的聚类算法,且不采用试错法,具有较低的时间复杂度,并且该指标可以处理具有任意分布的带有噪声点的数据集。
  2.基于边界点匹配和内点连通性的聚类有效性指标。该指标利用整个数据集与划分后的各个聚类簇的边界点、内点集合之间的匹配关系计算聚类数。该指标不依赖于具体的聚类算法,可以评价来自C-means,FCM和DBSCAN聚类算法的聚类结果,并且不仅可以评价聚类数参数,而且可以对聚类过程中的其他参数进行评价。该指标还可以对聚类算法进行评价,选出最优的聚类算法。
  3.基于行变换邻接矩阵幂次更新的聚类算法。该算法充分利用数据集中点对之间的近邻关系,通过构建邻接矩阵并进行幂次更新来挖掘数据集中隐藏的结构特征。并利用行变换对交叠区域的近邻关系进行优化,使得该算法可以应对含有交叠类的数据集。该算法不受数据分布的影响,对不同密度,不同大小,任意形状以及含有交叠类的数据集均具有较好的聚类效果。
  4.模糊聚类在电学层析成像中的应用。将模糊聚类算法应用到电学层析成像领域,提出一种基于模糊聚类的电学层析成像优化算法,该算法通过聚类分析将经典的图像重建算法进行融合,并根据数据点呈现的统计特征对伪影数据进行处理,进而减小伪影的影响,提高了图像的重建分辨率。
其他文献
本文提出了基于小波分析的电力电缆行波故障测距方法。该方法向待测电力电缆注入脉冲电流,利用小波分析对采样信号进行多分辨分析,得到模极大值点的位置,也就是采样信号突变点的位置,该突变点的位置反映了故障点的位置,从而实现电力电缆的故障测距。ATP/MATLAB下的仿真计算结果表明,较之于传统的行波测量方法,该方法可以准确识别反射脉冲,降低电缆线路分支和近区故障反射波对测量值的影响,且测距精度不受故障类型
学位
汴河是隋唐大运河中极为重要的一段,它兴盛于唐宋时期,为沟通南北交通,推动经济文化交流发挥了巨大作用。此后虽然汴河由于自然与人为因素而逐渐没落,但在当时促进城市商业的繁荣、经济的发展和政治地位的提高做出贡献。沿线的许多城市因汴河兴而兴,因汴河亡而亡,万胜与圃田就是汴河沿岸的重要城镇。万胜镇位于河南省中牟县东、圃田泽北,距离开封数十里的汴河南岸,在历史上地理位置十分特殊。唐宋时期万胜镇在军事和水利方面
近年来,越来越多的企业为了更多地占领市场和开拓新市场开始采用多元化战略,将现有的空闲资源有效运转利用,以不断拓展新的发展领域,优化整合各方资源,提升自身市场综合竞争力。企业在战略转型过程中,大多数企业都选择多元化发展战略来扩宽企业的经营范围及规模。虽然有些企业在多元化的道路上走向了成功,但是不可否认仍有不少企业多元化扩张失败使企业陷入困境。雏鹰农牧曾经作为A股“养猪第一股”,目前已经构建自养殖至销
双基合成孔径雷达(BistaticSyntheticApertureRadar,BiSAR)是一种将发射机和接收机放置于两个不同平台上的SAR。由于收、发平台的分置,可以根据不同的成像应用场景需求来配置相应运动平台的几何关系。与传统的单基SAR相比,双基SAR可以进行前视成像,获得丰富的目标信息,同时发射功率低、隐蔽性强,因此具有广阔的应用前景。  一站固定式双基SAR(One-stationar
由于外界扰动和内部摄动的影响,系统建模通常需要考虑各类参数的不确定性。分数阶不确定系统因其更符合实际情况受到广泛关注,相关的鲁棒稳定性问题及控制问题的研究是目前的重要研究方向。已有的研究成果针对不同类型的分数阶不确定系统,给出了一些分析系统鲁棒稳定性及鲁棒镇定的方法,但仍然存在一些复杂的情况难以用现有方法获得完整的结果,比如多参数的分数阶系统和阶次不确定的分数阶系统等。  柱形代数剖分方法是一种有
随着信息技术的不断进步,日常生活和工业环境中的数据持续增长,如何理解这些数据的含义从而帮助用户做出决策成为一项严峻而具有挑战性的难题。数值型数据在表述不确定信息时,往往无法达到对数据的完整性和准确性的要求,信息粒为解决这类不确定问题提供了更有效的解决方案。信息粒是基于数据的特征性和近似性精心设计并抽象化的数据集合,它可以完整并准确地表达数据的含义。通过信息粒化,复杂问题被分解为一系列易于处理的子问
学位
图像是人类社会重要的信息载体,发挥着无可替代的作用。然而,受成像条件的限制,成像系统获取的图像往往存在细节信息丢失、分辨率低等问题,从而无法满足不同应用领域对高质量图像的需求。超分辨重建技术旨在综合利用信号处理、统计学习、优化理论等工具,从同一场景的一幅或多幅低分辨图像重建出成像系统无法直接获取的高分辨图像。该技术对医学成像、遥感成像、视频监控等领域具有重要的应用价值,受到众多研究者的广泛关注和深
随着过去十几年在线社会媒体迅猛发展,人们越来越趋向于利用社交平台交流想法、分享信息甚至接受一些创新和新产品,从而加速了信息、产品等传播。此外,在很多其他网络化系统中我们也可以观察到类似传播现象,例如,人类或者动物真实社会网络中的疾病传播、工业网络中的级联失效传播以及计算机网络中的病毒传播。学者们针对如何用数学模型刻画这些复杂的个体行为来帮助人们更好地理解传播现象机制以及如何控制传播过程进行了大量的
学位
船舶在波浪中航行受到波浪的作用会产生横摇。横摇会降低乘客的舒适性,干扰船上人员的工作,影响船上设备的正常使用,导致船上运载的货物遭受损失,并且限制船舶的使用范围,严重的横摇甚至可以导致事故的发生,威胁航行安全。减小船舶的横摇对于确保船舶的使用性能及安全,拓展船舶的使用范围具有重要的现实意义。本文针对舵鳍联合减摇技术进行了研究,旨在提高船舶的横摇减摇能力。  为了减小横摇,对横摇稳定性要求较高的船舶
学位
随着互联网用户的数量和连接到Internet的设备迅速增加,网络规模的急剧变化对灵活和可扩展的网络管理存在巨大的需求。基于交换机的深度数据包检查技术(Deep Packet Inspection, DPI)的常规流量分析方案无法获取到网络中流的全局信息,且基于统计信息的交换机报告也缺乏流量的流级别深度信息。因此,对于细粒度的服务质量保证,内部网络管理,流量工程,安全性分析等,非常需要通过数据包采样
学位