基于高斯混合模型的非平衡数据对称翻转算法

来源 :信息与控制 | 被引量 : 0次 | 上传用户:zj8972108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统分类器对于非平衡数据的分类效果存在的问题,提出了一种基于高斯混合模型—期望最大化(GMM-EM)的对称翻转算法.该算法的核心思想是基于概率论中的“3σ法则”使数据达到平衡.首先,利用高斯混合模型和EM算法得到多数类与少数类数据的密度函数;其次,以少数类数据的均值为对称中心,根据“3σ法则”确定多数类侵入少数类的翻转边界,进行数据翻转,同时剔除与翻转区间中少数类原始数据数据重复的点;此时,若两类数据不平衡,则在翻转区域内使用概率密度增强方法使数据达到平衡.最后,从UCI、KEEL数据库中选取的14组数据使用决策树分类器对平衡后的数据进行分类,实例分析表明了该算法的有效性.
其他文献
近年来,海洋环境保护日益为人们所重视,而港口码头来自船舶的污染一直受到世界各国的关注。我国相关部门制定的相应法律法规相继出台,为防治码头船舶污染工作提供制度保障和技术支持。天津临港工业区是国家发改委规划的国家级石化基地,是天津市及天津滨海新区“十一五”规划重点发展区域之一,临港工业区总规划面积约80平方公里,一期规划面积约22平方公里。其发展目标是建设国家重要的化工基地、造修船基地、装备制造业基地
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
数值模拟作为一种有效的分析设计方法已广泛应用于内燃机的结构设计及性能分析中,然而现行的内燃机三维仿真分析软件大多来自国外,国内自主研发的相对较少。因此开发拥有源代
该课题针对目前温度检测仪表的现状及其存在的主要问题,设计了一种32路温度巡检仪.该仪表可扩展为0~99路,因此可以巡回检测多个测试点的温度,不仅具有精度高、功耗低等优点,还
耐压球壳的结构设计是载人潜水器中首要关键技术耐压球壳的质量占整个潜器总质量比例较高,因而对于耐压球壳的设计优化对载人潜器的总体性能的意义不言而喻。  本文依托于国
该文在国内首次对嵌入式系统设计方法进行系统的研究;研究过程中首次采用线程集成的概念,并且对线程集成的原理、实现方法以及相关技术等问题展开了分析研究,提出了符合嵌入
本文通过对荣华二采区10
期刊
基于双天线GPS/MIMU组合导航运算数据量大、实时性要求高以及考虑到导航计算机微型化、灵活性等特点,本文设计了以FPGA+DSP为硬件架构的双天线GPS/MIMU组合导航系统。本论文的
该文主要提出了一种以微处理器为核心的基于SC切晶体谐振器的新型微机补偿晶体振荡器(MCXO).介绍了SC切微机补偿晶体振荡器的构成,详细讲述了各部分电路的软硬件设计和工作原
本文以Matlab6.5为平台,首先建立了高速单体船推进和操纵系统的数学模型,并在Matlab/Simulink上建立了相应的仿真模型,实现了高速单体船推进和操纵的联合运动仿真;在仿真过程中,本