【摘 要】
:
随着计算机及其相关领域的持续发展,数据存储、分析的能力得到了巨大的提升,数据挖掘被广泛应用于各个行业。随之而来的,数据挖掘也面临了更多的挑战。由于不同应用场景下的数据集分布不同,一种算法不可能在所有形式的数据集上都适用。这就需要研究者根据数据集的类型提出相适应的理论来进行学习。对于半监督不平衡数据集,由于半监督、不平衡等特点,传统的算法在此数据集上很难有效。这就需要根据数据集的特点对传统算法进行改
论文部分内容阅读
随着计算机及其相关领域的持续发展,数据存储、分析的能力得到了巨大的提升,数据挖掘被广泛应用于各个行业。随之而来的,数据挖掘也面临了更多的挑战。由于不同应用场景下的数据集分布不同,一种算法不可能在所有形式的数据集上都适用。这就需要研究者根据数据集的类型提出相适应的理论来进行学习。对于半监督不平衡数据集,由于半监督、不平衡等特点,传统的算法在此数据集上很难有效。这就需要根据数据集的特点对传统算法进行改进,以适用于此类问题。本文对半监督问题、不平衡问题进行了大量的研究,在此基础上,根据数据集的特点,提出了半监督不平衡数据上分类问题的解决方案。本文主要工作如下:首先,介绍了半监督学习技术与不平衡学习技术的发展历程和基本理论。其次,提出了新的方法,在半监督数据集上,使用LDA分类器,通过无标记数据集消除标记数据集上类间的不平衡性。在平衡数据集上,使用BP-Adaboost分类算法对数据集进行分类。最后,针对本文提出的方法,在UCI数据集上对其进行分类效果的比较。试验表明,本文提出的方法相比传统方法,分类效果有显著的提高。
其他文献
储能系统作为微电网实现稳态运行和能量管理的核心与载体,具有削峰填谷、调压调频、应急备用等功能。锂离子电池具有能量密度大、功率密度大、充放电效率高、响应速度快等优
随着互联网和信息技术的快速发展,移动智能化时代的到来,实际生活中,人们的出行离不开定位与导航,汽车驾驶、出行路线规划等这些场景都与定位技术息息相关,当然这些都是室外
电液位置伺服系统是航空航天、军舰、石油开采、桥梁建设等大惯量重载荷工业驱动机构的核心系统,高性能电液位置伺服控制系统具有良好的低速稳定性、高频响应、高精度的特点,
无线传感网是集数据采集、数据传输、数据处理于一体的智能控制系统,有着巨大的应用范围和实用价值。IEEE1451标准提供了无线传感器的接口标准,此标准使得传感器配置简单、通
随着司法改革的深入推进,上海市基层检察院检察官员额比例确定为34%。然而,同一员额比例是否适用于办案业务量不尽相同的各基层院,似乎仍然有值得商榷之处。本文以上海市M区
随着城市不断发展,城市化水平不断提高,人们越来越关注城市安全问题。借助“天网工程”完备的视频监控体系,公安干警可以借助影像资料追溯嫌疑人和走失人员,并还原出轨迹路线
车型精细识别旨对外观差异较小的车辆进行细粒度型号分类,其广泛应用于统计交通流量、公路自动收费以及无人驾驶等领域。然而,已有车型精细识别方法仍存在以下问题:一方面,多
得益于无线通信技术、遥感技术、计算机技术和微型电子制造技术的迅速发展,无线可充电传感器网络(Wireless Rechargeable Sensor Networks,WRSNs)应运而生并得到广泛应用。与
随着“中国制造2025”概念的提出与实施,国家组织实施大型飞机、民用航天等项目的开展,使得工业机器人越来越多地应用于航空制造业进行零部件的加工及柔性化自动装配中。在航
点云配准的目标是计算点云之间相对变换,将两个或者多个点云转换到同一坐标系下完成对齐。点云在扫描过程中往往会存在噪声、异常点、缺失等问题,这些问题加大了配准难度。本