【摘 要】
:
本文主要对遗传算法以及模糊C均值算法(Fuzzy C-Means,FCM)进行研究和改进,并依据改进的遗传算法和模糊C均值算法,对文本聚类系统进行了设计。FCM算法作为应用最为广泛的一种基
论文部分内容阅读
本文主要对遗传算法以及模糊C均值算法(Fuzzy C-Means,FCM)进行研究和改进,并依据改进的遗传算法和模糊C均值算法,对文本聚类系统进行了设计。FCM算法作为应用最为广泛的一种基于目标函数的模糊聚类算法,思想简单且易于实现,同时具有较明显的聚类效果,但该算法的聚类质量与初始聚类中心的好坏密切相关,易陷入局部最优。而遗传算法由于种群收敛速度和搜索速度的不一致,很容易发生早熟现象,进而影响算法的全局寻优效果。 本文针对FCM算法和遗传算法存在的缺陷,针对以下方面展开了研究: (1)提出了基于动态选择的遗传算法,有效的改进了遗传算法的早熟问题。 (2)将模糊C均值算法与动态选择遗传算法相结合,利用动态选择遗传算法的全局寻优能力来寻找全局最优聚类中心,进而解决了模糊C均值算法对初始聚类中心较为敏感的缺点。 除此之外,依据以上研究内容,本文对文本聚类系统进行了设计,使系统获得更好的文本聚类效果。 实验表明,本文提出的基于动态选择遗传算法的模糊C均值算法在文本聚类系统中可以取得较好的聚类效果。
其他文献
该文首选讨论了虚拟主机的定义、关键问题、技术路线以及评价标准,然后综合吩析了现有的各种实现方法.在此基础上,作者们提出了用于曙光大型信息服务系统的三层结构虚拟主机
该文通过对用户界面的与分析,结合具体实例,详细描述了用户界面设计的好用性目标,以及影响用户界面好用性的两方面重要因素,即--Mental Model和Look and Feel,对它们在用户界
该文对网络入侵检测技术进行了研究,并在此基础上构造了一个基于Agent的分布式入侵检测系统DIDIAs.该文首先分析了Internet安全性问题存在的原因、当前普遍采用的网络安全技
该论文研究的内容是以数据加密与认证为重点的电信管理网(TMN)数据安全性问题.该文首先研究了TMN的整体概貌和组成特点,在此基础上,对其数据安全性进行了基础分析,定义了TMN
该文通过对开发Web应用系统的各种方法进行分析和比较,给出了Web计算模式的理论与实现方法.文章中介绍了Web计算模式的起源和现状,提出了Web计算模式的逻辑结构,分析了Web计
该文介绍了"天罗个人信息代理"系统的技术基础、实现方法及性能指标."天罗个人信息代理"系统是一个主动的信息服务软件.它以一种高频属性优先,时空性能较好的判定树的数据结
虚拟现实是一种可以创建和体验虚拟世界的计算机系统.它是一种新兴的、极有应用前景的计算机应用交叉技术.它利用计算机,生成通过视、听、触觉等作用于用户,使之产生身临其境
该文讨论了目前中国政府机关,企、事业单位发送文件主要采用的几种方法,并且分析了它们的优缺点.通过对国内发送公文现状的研究,该文提出了一种快速、安全、经济的发文方法,
受R. Feynman, D. Deutsch等人工作的启示,我们形式地建立了物理可计算理论以及相应的物理复杂度理论。文章中建立了一个评估框架,它可以用来评估几乎所有利用物理机制进行的
该文的工作是在SSRE系统的基础上进行的.首先,将SSRE从仅支持单构件扩展到支持多构件库,实现了对多库的管理和重组.从而不同应用领域的可重用构件可以分库存放,避免了库的庞