【摘 要】
:
针对因不平衡数据中小类实例少、关联分类算法挖掘到小类规则少且小类规则的置信度较低,使得小类规则排序优先级低,从而导致小类的分类准确率较低的问题,提出类间相关率度量
【基金项目】
:
国家自然科学基金项目(61170129), 福建省自然科学基金项目(2013J01259), 福建省中青年教师教育科研项目(JA15303)
论文部分内容阅读
针对因不平衡数据中小类实例少、关联分类算法挖掘到小类规则少且小类规则的置信度较低,使得小类规则排序优先级低,从而导致小类的分类准确率较低的问题,提出类间相关率度量规则前件与预测类别相对于其他每一类别的相对相关程度;利用类间相关率挖掘规则得到更多小类规则;综合考虑规则前件、预测类别、规则前件补集、预测类别补集之间的关系,提出新的规则强度度量方法,以提高小类排序时的优先级。结果表明,本文中的算法能有效地提高不平衡数据中小类的查全率,进而较大地改善了不平衡数据的查全率几何平均值。
其他文献
立足于当前职业资格培训的现实需求,从传统集中面授培训中存在的问题出发,通过分析国内外前沿的信息化教学、培训等理论和实践,在借鉴前人研究成果基础上,自主搭建Moodle平台
为加强高等院校教材收费管理,提高教材收费管理水平,开发一套教材收费管理系统。采用C#和SQL Server 2005,设计并实现教材收费管理系统的相关功能,例如收费数据的录入、统计
为避免因核心交换机故障造成医院网络大规模瘫痪,从VRRP协议工作原理上阐述医院三层核心交换机的路由冗余备份,核心交换机处于网络的中心,它担负着不同VLAN之间的数据传输和
以校园楼宇及环境为例,采用B/S模式,应用3DMax、WebMax、VRPIE等开发工具,设计并实现基于Web虚拟现实技术的虚拟校园漫游系统,该技术除了可应用于楼宇智能化工程专业的教学实
随着计算机技术的普及,企业信息化建设快速发展,企业中利用计算机软件完成产品管理的程度越来越广泛。企业产品出入库票据是产品流通的有效凭证,因此根据企业需求设计合理的
为了能够处理试卷质量评价中既有可比性又有不可比性的模糊语言值信息,在语言值格蕴涵代数的基础上,提出语言值加权平均算子并讨论其相关性质,建立一套试卷质量评价的指标体
目前,网络入侵攻击的事件频繁发生,对计算机网络安全造成严重影响。因此需要一种较好的入侵检测技术,来防止网络入侵的各种攻击,提高计算机系统的安全性。先介绍网络入侵检测技术