基于蚁群算法的混合属性数据集聚类方法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户：ymhd_hhxx

【摘要】

：

数据挖掘的目的是从海量的数据中提取人们感兴趣的，有价值的知识和重要的信息，聚类分析则是数据挖掘的一个重要研究领域。它在商业、生物、医学、地质、Web文档等方面都有重要

【作者】

：

赵伟丽

【机构】

：

东北大学

【出处】

：

东北大学

【发表日期】

：

2006年期

【关键词】

：

数据挖掘聚类分析数值属性类属性蚁群算法信息熵

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据挖掘的目的是从海量的数据中提取人们感兴趣的，有价值的知识和重要的信息，聚类分析则是数据挖掘的一个重要研究领域。它在商业、生物、医学、地质、Web文档等方面都有重要的应用，是当前的研究热点问题之一。本文对混合属性数据集聚类方法进行了研究，主要做了以下工作： 1．将基于蚁群的聚类算法用于混合属性数据集的聚类问题。在基本蚁群聚类算法(LF算法)的基础上，提出了一种改进的基本蚁群聚类算法(ILF算法)，在该算法中，引入了公式改进、半径递增、短期记忆、空间分割等策略，大大提高了算法的效率，并且使聚类性能得到较好的改善。同时，该算法利用了自适应原理，在一定程度上，可以加快进化过程，而且是一种本质上分布并列的算法，因此具有很高的效率，适合数据集聚类分析。同时采用了一种新的距离测度函数将数值特征与类属特征相结合，从而实现了具有混合属性特征数据的聚类分析。通过对UCI数据库进行测试，仿真实验结果表明，改进后的算法具有较强的鲁棒性，对于处理具有混合特征的数据集聚类问题是相当有效的，最后的聚类质量也达到了令人满意的效果。 2．对基于信息熵的蚁群聚类算法(EAC算法)进行改进，提出了IEAC算法，通过信息熵的计算与比较，改变了拾起和放下数据的规则，减少了参数设置，并通过半径递增、短期记忆、强行放下等策略，提高了聚类性能。这种方法对于处理混合属性数据集尤其是类属性数据集聚类问题是相当有效的。

其他文献

湖南税务高等专科学校配电间北侧边坡灌浆加固技术

期刊

中铝、力拓携手购买蒙古铜金矿

据报道,中铝、力拓可能携手投资蒙古OyuTolgoi铜金矿。如果中铝成功投资该项目,这将是中铝2010年第二次与力拓联手投资。力拓已证实,将用所持加拿大艾芬豪矿业集团的股份换取

期刊

铜金矿艾芬所持新浪财经中蒙边境

线性切换正系统的稳定性

切换系统是由连续时间子系统或离散时间子系统以及控制子系统之间进行切换的切换信号控制的一种混杂的动态系统。切换系统具有更大的难度和复杂性,原因在于切换系统不仅有其

学位

切换系统平均驻留时间稳定性李雅普诺夫函数

桥梁施工中风险管理理论及实践分析

期刊

基于网络流的供应链模型研究

供应链是在世界经济的一体化发展和市场竞争不断加剧的大趋势下产生的能创造竞争优势的一种手段。现在,它已成为企业增强自身竞争力的重要方法。因此,如何建立和求解供应链模型,以定量的手段对供应链中的决策提供支持,是一项非常具有研究价值的课题。由于供应链问题的多层次性和多目标性,使得有关供应链模型的研究多停留在定性研究之上,缺少依据数学模型进行的定量描述,以及对已有复杂数学模型缺乏有效的求解方法。而多层多目

学位

供应链网络流多层多目标规划遗传算法

周期非均匀波导的DtN映射算法

波导计算在集成光学的研究中具有重要作用。针对更多实际应用的周期非均匀的波导结构，本文发展了一些基于DtN映射的M算子方法和逆基本解算子方法(IFS)。与传统的算法相比，这些

学位

周期非均匀光波导结构非齐次Helmholtz方程逆基本解算子映射算法集成光学

具有随机扰动的食饵-捕食者系统及其参数的极大似然估计

经过一个世纪的发展，生物数学模型的研究得到了广泛的应用.在二十一世纪，有关生物数学的研究显得越发重要，生物数学与其他学科的交叉领域将成为主要的研究对象.与确定性生物数学

学位

布朗运动伊藤公式食饵-捕食者系统全局渐近稳定性极大似然估计

Szasz-Kantorovich算子迭代布尔和的逼近性质

本文利用Ditzian-Totik光滑模讨论了Szasz-Kantorovich算子Ln(f)的迭代布尔和⊕тLn(f)对Lp[0，+∞)(1≤p≤+∞)中的函数的逼近正定理及等价定理.主要结果如下：设f∈Lp[0，+∞)，1≤