RBF网络在数据挖掘中的应用研究及其算法改进

来源 :中山大学 | 被引量 : 0次 | 上传用户:kelly_0810
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大量数据中挖掘出有用的信息正成为一个迫切需要解决的问题,正是这种需求推动了数据挖掘技术的发展。数据挖掘经常要面对一些有噪声、杂乱、非线性的数据,而神经网络具有良好的鲁棒性、自适应性、并行处理、分布存储和高度容错性等特点,因此神经网络非常适合用来解决数据挖掘的一些问题。 RBF网络是人工神经网络中最受关注的模型。RBF神经网络的基本思想是用径向基函数作为隐单元的“基”,构成隐含层空间,隐含层对输入矢量进行变换,将低维的模式输入数据变换到高维空问内,使得在低维空间的线性不可分问题在高维空间内线性可分。 在RBF网络中,隐含层节点的选择是一个非常重要的因素,本论文对目前RBF隐含层中心点的选择问题的几种通常的解决办法进行了介绍分析。K-均值算法是中心点选择算法中最常用的一种算法,本文重点研究该算法在RBF网络构造中的应用,对其进行了改进以使其能适用于高维和分布复杂的数据。研究工作如下: (1)介绍了目前RBF隐含层中心点选择问题的几种通常的解决办法。 (2)分析了用欧氏距离度量时K-均值算法易受噪声影响的缺点,从而引入了高斯基距离度量,并且关注初始中心点的选择,实证分析了基于距离优化的K均值RBF中心点选择法。通过实证分析,验证了高斯基距离度量比欧氏距离度量能够改进各种算法的效果,高斯基距离度量是高维复杂分布的数据的理想的距离度量方法。 (3)针对K-均值算法易受初始化中心点影响的问题,本文提出一种改进的算法,即基于分箱的K均值RBF中心点选择法。本方法将分箱思想引入聚类算法中,利用分箱函数将原数据映射到不同的单元中,然后按照单元密度的大小进行初始中心点的选择,从而对K均值算法进行改进,使其用于RBF中心点选择时可以适用于高维复杂数据。通过对各种方法进行实证分析,验证了本文提出的改进算法的有效性。
其他文献
Matlab具有卓越的计算功能和仿真可视化能力,在物理电磁学等各类场的数值仿真中具有无比的优势。本文是利用Matlab 软件进行中学物理静电场教学的典型案例。将 Matlab 引入电
新课改指导下,语文教学变更了常规思路,采纳了读写结合这种新思路。在传统教学中,学生经常被动予以仿写,很难拓展并创新。语文密切关系到平日生活,二者是不可脱离的。发掘创新潜能
要永葆党的活力,必须坚持标准、严格入口,改善结构、激活党的组织,强化管理、疏通出口、纯洁党的组织。 To constantly maintain the vitality of the party, we must uphol
图像插值需要把待插值像素映射到原始图像的某个“位置”,因而要通过对这个位置周围“存在”的像素应用预先定义的插值函数求取其灰度值,其本质是通过低分辨率像素的灰度值“
随着神经网络理论的发展,神经网络已经有很多的研究方向。针对稳定性理论在神经网络中的巨大影响,本文主要探讨了离散神经网络、随机神经网络、中立型神经网络的稳定性。具体结
阅读教学是学生、教师与文章之间的对话过程,是一种智力活动。著名教育家苏霍姆林斯基说:“积累三十年的经验,使我确信学生的智力取决于良好的阅读习惯。”可见阅读在学习中是至
局部上同调理论是研究代数几何和代数拓扑的重要工具.许多数学家对局部上同调理论进行了研究,并将它进行了发展.对于有限生成模的局部上同调模,很多学者已经进行了研究并得出了很
最近,空间动力学性态在捕食被捕食系统中引起了广泛关注。本文主要研究捕食被捕食反应扩散模型的图灵斑图结构和行波解。 在第二章中,研究了基于经典Bazykin模型的反应扩散
“数学难”是高中学生普遍反映的问题。问题的症结所在,是由于初、高中数学结构、教学模式等方面的差异,导致学生在高一起始阶段无法适应高中数学学习,甚至少数学生对数学学
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊