【摘 要】
:
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛应用,并迫切需要将这些数据转换成有用的信息和知识。相关模式挖掘是发现向量集合中的相关模式,它
论文部分内容阅读
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛应用,并迫切需要将这些数据转换成有用的信息和知识。相关模式挖掘是发现向量集合中的相关模式,它是数据挖掘中重要的研究内容。基于相关的聚类是把向量之间的相关度作为向量之间的距离度量,对向量集合进行聚类。然而,对于高维向量,数据分析人员根据向量在全部维上的相关性未必能够找到基于相关的聚类,这就需要挖掘在子空间上基于相关的聚类--高维数据中子空间相关聚类挖掘。
关于基于相关的聚类有许多已有的研究工作。紧密相关类簇挖掘就以相关度作为向量的距离挖掘向量集合中基于相关的聚类。但是它在向量的全部维上计算相关性,有时很难找到在全部维上都相关向量集合。还有一类研究工作将统计方法与传统的聚类方法结合在一起,挖掘基于相关的聚类,如将PCA与传统聚类算法结合起来,运用PCA进行特征转换会形成若干子空间,这些相关聚类就是在这些子空间上形成的基于相关的聚类,但是这些子空间是由原来的维坐标变换而来的新维构成,这样的子空间以及子空间上的基于相关的聚类对应到应用领域中难于理解。
本文从实际问题出发,研究高维数据中子空间相关聚类挖掘问题。引入新的相关度量,该度量能够判断向量间是否同升同降,使向量的相关性易于解释,可以很好的应用到实际分析中;根据本文中定义的相关度量的性质,能够有效的裁剪对子空间搜索的范围,而且判断向量是否属于某一相关聚类时不需要与聚类中其他向量进行比较,算法得到很大的优化。
根据挖掘对象的不同数据特征,本文从两个方面研究高维数据中子空间相关聚类挖掘问题:
1.维无序数据集中子空间相关聚类挖掘针对维无序的向量集,以自顶向下的策略发现最大子空间相关聚类,并提出TOUR算法和CAMEL-tree结构,通过填充CAMEL-tree形成候选子空间相关聚类,并根据CAMEL-Tree节点的父子关系找到最大子空间相关聚类。本文应用超市数据集实验并进行了性能分析。
2.维有序数据集中子空间相关聚类挖掘针对维有序的向量集,有两个挖掘任务:一是发现连续子空间上的最大子空间相关聚类,另一个是挖掘最大延迟相关聚类集。提出DUMA算法以自底向上的策略把区间较小的子空间相关聚类合并得到区间较长的子空间相关聚类,再利用CAMEL-Tree查找最大子空间相关聚类。通过对最大子空间相关聚类的区间匹配发现不同延迟量下的延迟相关的最大子空间相关聚类的集合。本文应用股票价格数据集实验并进行了性能分析。
其他文献
本文以齿轮箱故障诊断为课题研究背景,研究了近年来出现的一种自适应时频分析方法—局域均值分解(local mean decomposition,简称LMD)方法。该方法能应用在非平稳信号的分析和处理中,为机械设备的诊断提供了一种新方法。在研究LMD方法的基础理论与实现过程的基础上,针对LMD方法在实际应用中遇到的问题,提出了基于三次函数插值的LMD改进算法,以避免LMD分解中存在的滑动平滑跨度选取不
图像识别技术是智能控制技术的一个重要研究方向,在现代自动控制技术中图像识别技术占有非常重要的地位。通常生产中使用的人工视觉检测方法很难达到检测精度得要求,所以会经常
抠图(Matting)技术是一种广泛应用于图像编辑,视频处理的数字图像处理技术,Matting的目标是把图像的前景部分从图像背景中分离出来,为视频制作、基于图像的建模、绘制等提供了原
不间断电源(UPS)因其能为用电设备提供持续且高质量的交流电源而得到广泛应用。逆变系统作为UPS的核心功率部分,其性能直接影响着UPS输出交流电源的质量。因此,研究逆变系统对于设计不间断电源具有重要的现实意义和应用价值。为了使单相UPS逆变系统输出高质量的交流电源,本文致力于其控制技术的研究。首先研究了逆变桥的SPWM控制策略,在此开环控制的基础上研究了基于逆变系统输出电感电流与电容电压的双闭环控
智能家居的总体目标是采用电子技术、无线网络技术和计算机技术建立一个家庭信息服务和管理系统,以此来提高人们居住水平。智能家居系统要求布线简单、功能多样、扩展灵活。Zi
三维成型作为快速成型技术的一种,已经成为现代制造加工业生产链中的新兴技术,被广泛地应用到各行各业。目前国内外学者及公司对三维成型机的研究多致力于应用领域的扩展及软
随着经济的发展,人民生活水平不断提高,医疗技术的飞速进步,截肢者对于假肢舒适度的要求也越来越高。残疾人佩戴假肢的舒适度与假肢的控制方法直接相关,自然界给予人类稳定高效的
在工业生产过程中,不可避免的会发生设备损耗和故障的情况,不但影响产品的质量,有时还会发生重大生产事故,完全依靠人力的传统监测方法已不足以解决复杂的质量控制问题。基于
低压电器试验是鉴定低压电器产品质量的一个重要环节,是改进设计和新产品开发的重要依据,它可以验证电器产品是否符合相关标准的规定,是否存在影响运行的各种缺陷,从而可以及时发现产品的问题。因此,对低压电器试验结果的正确采集,可以为电器失效机理的研究奠定测试与分析基础,进而从试验中获得产品失效的原因,对产品的优化设计提供指导性的帮助。为了解决现有PCI-6254测量系统存在不可移动、价格昂贵以及采样率低而
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.