论文部分内容阅读
伴随计算机计算能力、存储能力的大幅提升和移动互联网规模的飞速发展,电子商务、社交媒体、信息科技等领域每时每刻都会产生大量的海量数据。如何从复杂、稀疏的海量数据中高效的挖掘有用的隐含信息成为“人工智能”背景下社会发展进步的迫切需求。聚类分析作为数据挖掘领域中一类经典的无监督学习方法,可以在缺乏训练样本的情况下,找出数据间潜在的结构关系,在现有实际数据大多缺乏标记的背景下,具有无监督学习能力的聚类分析技术已然成为人工智能领域的研究热点之一。由于无监督学习的特性,现阶段多数聚类算法都需要人工设置关键参数,在面对高维、复杂数据,人工难以寻找合适的全局参数,因此在大数据环境下找到合适的全局参数就成为提高聚类分析算法性能的关键问题。本文以此类问题为出发点,利用群体智能算法效率高、收敛快的寻优特点,对果蝇优化算法和布谷鸟搜索算法进行改进,提升算法寻优能力和效率,并将其应用于解决近邻传播算法参数优化问题,从而形成新的聚类分析模型。本文的主要内容和创新如下:(1)针对传统果蝇优化算法全局搜索能力不足、易于早熟的问题,提出基于知识记忆的果蝇优化算法(KM-FOA),算法加入个体知识记忆机制。知识记忆机制中引入方向向量概念,并作为知识用于优化果蝇搜索路径,从而达到在算法初期快速定位最优解区域的目的。实验结果表明KM-FOA在解决多维优化问题时取得较好效果。(2)提出一种基于边界识别的新型布谷鸟搜索算法。针对原始布谷鸟算法搜索效率低,算法收敛速度较慢的问题,提出了边界识别方法。通过快速勾勒群体搜索边界,提升个体搜索效率。并将该模型应用于解决PID控制器的设计问题。实验结果表明,所提出的模型能够找到较少绝对误差(ITAE)指标的合理参数。(3)提出了一种新的果蝇趋势搜索与协同进化算法。构建了基于正负反馈的趋势搜索策略,达到加快算法收敛速度的目的;在此基础上,采用协同进化机制来避免早熟收敛,提高全局搜索能力,并将改进后的算法优化近邻传播聚类(AP)中的偏向参数。仿真结果表明,提出的改进AP聚类模型具有较好的研究潜力和应用价值。(4)在引入先验成对约束度量条件的半监督近邻传播算法基础上,提出基于模糊密度的果蝇优化半监督近邻传播聚类模型。利用改进果蝇优化算法的全局寻优能力,寻优偏向参数和阻尼因子两个参数空间,并根据Silhouette聚类评价指标确定最佳聚类。在此基础上应用改进的模型分析地震数据,取得了较好的实验结果。