论文部分内容阅读
聚类分析,是指用数学的方法研究和处理给定对象的分类,它是多元统计分析的一种,也是非监督模式识别的一个重要分支。它把一个没有类别标记的样本集按某种准则划分成若干个子集,使相似的样本尽可能归为一类,而不相似的样本尽量划分到不同的类中。遗传算法起源于对生物系统所进行的计算机模拟研究。它是现代优化技术的一种,具有全局的,并行高效的优化性能,鲁棒性、通用性强,无需问题特殊信息等优点。其内容涉及数学、物理学、生物学和计算机科学等方面,为解决复杂问题提供了新的思路和手段。本文将遗传算法应用于对聚类目标函数的优化问题。针对椭圆状数据应用自适应遗传算法,避免了用单纯聚类方法容易陷入局部极小值的问题。实验结果表明,这种新算法具有较好的鲁棒性。本文共分四章,主要内容如下:第一章为绪论,阐述了聚类分析研究的基本问题,以及遗传算法在优化聚类目标函数问题时的必然性和合理性。第二章回顾了聚类算法的发展历程,重点介绍和推导了基于目标函数的模糊c-均值算法(FCM),并分析了传统聚类算法各自的优缺点。最后,运用FCM算法处理了与基金相关的数据,验证了该算法的有效性。第三章主要分析了模糊椭圆聚类算法(FCE)的缺点,以及产生这些缺点的原因所在,即FCE在初值确定和基于迭代法的交替寻优策略上过度依赖FCM算法,这必然导致FCE算法在实践中往往得不到令人满意的聚类效果。基于此,我们将FCE算法与遗传算法巧妙地结合起来,提出了一种新算法—模糊自适应椭圆算法(AGA-FCE)。数值试验表明,文中所提出的新算法具有较好的抗噪性,并且在优化过程中避免了传统算法易陷入局部极小值的缺点。从而证明了该方法的有效性。最后一章是结论部分。总结了本研究的贡献,并简要叙述了以后的研究前景。