基于支持向量机的数据挖掘及其应用研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:a479704375
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining,DM)是指从大量数据中发现隐含在其中并潜在有用的知识的过程。数据挖掘是一个多学科交叉研究领域,涉及数据库技术、统计学、机器学习、人工智能、模式识别、计算智能等,经过十多年的发展,数据挖掘技术已趋于成熟,形式了一套完整的理论体系,并广泛应用于经济和社会生活的各个领域。   算法是数据挖掘技术的核心,优秀的算法能够显著提高数据挖掘的性能和效果。支持向量机算法是一种基于统计学习理论的机器学习方法,可以有效避免维数过高和过拟合,更适合解决小样本问题。支持向量机在数据挖掘中主要用于分类与时间序列预测,本文针对各自的特点,深入研究支持向量机及其改进算法,以解决实际应用问题,主要包括以下两个方面:   (1)在基于机器学习方法的油气藏地球化学勘探研究中,多数方法是通过有监督学习的分类算法进行分类预测。在油田实际应用中,为了获得更好的效果,往往需要大量的已标记样本用于分类器的学习,因此在样本的搜集和标注上会耗费一定的人力和时间。针对支持向量机算法的特点,本文研究基于后验概率的主动学习支持向量机多类分类算法,通过主动选择有利于提升分类器性能的样本,使得在减少训练样本数量的情况下保证分类器的精度。以山东胜利油田花沟地区的化探资料为实例,实验表明基于主动学习的支持向量机算法在训练样本数较少的情况下便可获得更高的分类准确率,证实了该算法的优越性。   (2)在对气候时间序列进行的短期气候预测中,根据气候序列具有的非线性、非平稳特性,利用支持向量机算法在处理非线性问题中的优越性和经验模态分解算法在处理非平稳信号中的优势,采用将经验模态分解与支持向量机相结合的短期气候预测方法,并应用到广西季节降水预报中。选取广西全区88个气象观测站1957-2005年6-8月逐年降水量的距平百分率序列作为实验数据,并采用不经过经验模态分解处理的RBF神经网络和支持向量机回归算法进行对比验证,结果表明相对于直接预测方法,本文提出的方法具有更高的预测精度和较好的推广能力。
其他文献
人工影响天气技术以基本气象业务系统为依托,以气象探测和数值模式为基础,采用先进催化技术和手段,以功能完善的作业指挥系统和布局合理的作业基地为平台,不断提高作业的社会、经
遥感图像的分类是获取图像信息的主要途径之一。传统的目视解译方法已远远不能满足海量数据处理的需要,因此,研究计算机智能识别分类,对于批量加工数据,减少信息提取的周期,具有十分重要的意义。支持向量机(Support Vector Machine,SVM)技术是近年来智能分类领域的热点。它于九十年代中期提出,在统计学习理论基础上结合了二次规划、核方法等已有理论,具有良好的推广能力。其先进的理论背景,使之
随着城市发展和用电负荷的不断增加,近年来在城市中心逐渐兴建了一批11OkV及以上电压等级的变电站,原来许多郊区变电站也随着城市扩张被纳入到市区范围内,城市中心变电站数量越来越多。城市中心变电站对于电能质量和环境影响提出了更高的要求,而站内大量使用的电缆进出线又带来了充电无功功率过高的问题,传统的无功补偿以配置固定电容器和电抗器为主,不能平滑补偿无功,且运行噪音过大,干扰了周围居民的正常生活,已经不
混合光伏-风力系统由太阳能光伏,风力发电机组,逆变器,电池和其他组件组合而成。一旦电力资源(风能和太阳能)充足,所产生的多余电能需由电池消纳,直至电池完全充电。电池作为电能储
随着电气化铁路的发展,电力电子装置的大量使用,谐波已经影响到我国电网和设备的安全运行,必须加以治理和管理。非线性负载作为电网主要的谐波源,向电网注入高次谐波,引起三相不平
随着我国电网规模的扩大和特高压技术的发展,人们对电磁污染的关注日益增加,同时国家对电网建设的电场环保标准日趋严格。因此分析和治理变电站内工频电场的影响显得异常重要。求解该问题的现有边界元方法主要难点在于计算量和存储量大、计算效率低和迭代收敛速度慢。针对变电站内工频电场计算的技术难题,本文的主要研究工作如下:①分析了变电站内工频电场计算的特点,以格林函数为基础推导了间接边界元积分方程;结合变电站内工
学科建设是高等院校科研与教学的结合点,是学校办学水平的重要标志。实施学科评估也是加强研究生教育,促进科学研究,提高人才培养质量的一个重要手段。本文针对学科建设评估中存
与传统电磁式互感器相比,电子式互感器在带宽、绝缘和成本等方面都具有优势,代表了高压电网电流和电压测量工具的发展方向。随着智能电网、数字化变电站技术的逐步推广,电子式互感器成为人们研究的热点;越来越多的新技术被引入到电子式互感器设计中,降低系统运行总成本,减小对生态环境的压力。然而,作为电力系统的一个新生事物,能否在恶劣的环境下长时间连续稳定的工作,成为其实用化道路上的核心问题。因此,对电子式互感器
随着信息技术的发展和广泛应用,企业逐渐意识到利用纸张办公这种传统模式不能够满足业务发展的需要,成为企业竞争力的最大绊脚石。将现有的信息技术运用到各自的业务当中,企
随着光伏并网规模不断增大,它所面临的最大困难和挑战是其天然具有的随机性、不确定性和低可控性,能否有效应对上述挑战关乎新能源发电发展的速度快慢甚至成败问题。此外,电动汽车产业已经逐步成为一种新兴产业,如何经济、合理地控制电动汽车的充放电,是电动汽车接入电网需要解决的问题。为此,本文针对光伏发电的不确定性,采用博弈论建模并分析含光伏电站与电动汽车的区域电网优化调度方面的问题,以期为应对新能源发电的不确