【摘 要】
:
不平衡数据的问题普遍存在于大数据、机器学习的各个应用领域,如医疗诊断、异常检测等。研究者提出或采用了多种方法来进行不平衡数据的学习,比如数据采样(如SMOTE)或者集成学
【机 构】
:
国防科技大学并行与分布处理国家重点实验室
【基金项目】
:
国家重点基础研究发展计划(0800067314001);国家自然科学基金项目(61602500,61502500)资助
论文部分内容阅读
不平衡数据的问题普遍存在于大数据、机器学习的各个应用领域,如医疗诊断、异常检测等。研究者提出或采用了多种方法来进行不平衡数据的学习,比如数据采样(如SMOTE)或者集成学习(如EasyEnsemble)的方法。数据采样中的过采样方法可能存在过拟合或边界样本分类准确率较低等问题,而欠采样方法则可能导致欠拟合。文中将SMOTE,Bagging,Boosting等算法的基本思想进行融合,提出了Rotation SMOTE算法。该算法通过在Boosting过程中根据基分类器的预测结果对少数类样本进行SMOTE来间
其他文献
随着当代社会社会生产力的需求日益增多,90后的应届毕业大学生逐渐成为当今社会生产力中的主力军。当然,在社会环境和家庭环境的影响下,90后大学生在上岗前的培训开发中出现
分析了传统电流传感器存在的固有误差及其影响因素;根据磁动势方程设计了一种双级结构的电流传感器,以消除励磁误差;由电磁感应定律与磁路定律建立了传感器的仿真模型;采用DS
罪刑相适应原则是我国新刑法确立的基本原则之一,虽然这一原则在国外刑法中由来已久,但是在我国刑法中却为时不长,因此,如何弄清其理论基础,从而更好地为定罪量刑服务,就具有
进行性核上性麻痹(progressive supranuclear palsy,PSP)是一种罕见的神经变性病,PSP的主要病理改变有基底节、脑干、小脑等部位的神经细胞缺失、胶质增生、神经纤维缠结等,PSP
<正>因有了1935年9月那次幸遇,甘肃哈宕昌县哈达铺成为红军长征路上的加油站。当我们进入哈达铺时,历史上曾有"陇南商贸重镇"之称的小镇已没有了往日的繁华,剩下的则是宁静和
黄河中下游地区长期以来被视为大豆起源地之一。近年来以考古材料为基础,对黄河中下游地区大豆起源与驯化研究,集中于炭化种子的尺寸分析,已大致可以看出尺寸分化的历时性演
进一步探索职业教育产学研结合模式,推进职业教育产学研结合,是当前推进职业教育发展的一大举措。本文基于职业教育产学研结合的现状,从经费投入、制度衔接和人才培养三个结
电流互感器电磁暂态过程仿真,在电力系统动态仿真系统中是必不可少的,为此提出了一个电流互感器的非线性实时仿真模型。模型中考虑了磁饱和和磁滞的影响,同时给出了相应的数
本文研究电解锰废水对水稻的生态毒性;探索三维电解法处理电解锰生产实际废水的效果,试验用规整三维填料,分别通过单因素试验和正交试验确定电压、时间、pH值、电极板间距和