【摘 要】
:
在数据挖掘和机器学习领域,随着大规模、高维数据的不断涌现,特征选择已成为模式识别技术的核心问题之一。大量无关或冗余特征的存在不仅造成了维数灾难,还直接影响了分类器性能
论文部分内容阅读
在数据挖掘和机器学习领域,随着大规模、高维数据的不断涌现,特征选择已成为模式识别技术的核心问题之一。大量无关或冗余特征的存在不仅造成了维数灾难,还直接影响了分类器性能,因此需要对数据进行特征选择。特征选择是根据某种评估标准,从原始特征空间中除去不相关、冗余特征,以达到降低数据维数的目的。支持向量机(SVM)作为一种有效的识别工具,已被广泛应用于各领域,并在小样本高维数据中有其独特优势,本文将以支持向量机作为分类器用于特征选择。 基于不同的评价准则,许多不同有效的特征选择算法被提出,但面对错综复杂的数据问题,特征选择技术还需不断完善。本文采用了一种基于SVM-RFE和粒子群算法(PSO)的两阶段特征选择算法,从特征选择搜索策略来看,SVM-RFE属于启发式序列后向选择算法,搜索速度快,但不能有效识别冗余特征。粒子群算法则是一种随机搜索智能优化算法,理论上能找到问题的最优解,其结果具有较高的不确定性。本文将利用SVM-RFE和粒子群算法的不同优势进行数据降维,首先利用SVM-RFE算法对特征进行排序,并按一定准则快速去掉部分无关特征,初步降低数据维数,然后以SVM-RFE排序后的优良子集初始化后续粒子群算法的部分种群,使其有一个好的搜索起点。因此,SVM-RFE算法能为后续粒子群算法提供较好的先验知识,减少了粒子搜索空间,并在一定程度上提高了算法选择效率。在粒子群算法中,采用自适应权重参数来有效避免算法过早收敛等问题。 最后,通过UCI数据库的不同数据集进行验证,实验结果表明:比起单一的SVM-RFE和粒子群特征选择算法,该方法在不降低分类性能的情况下,能得到属性维数更少的子集,且在高维数据集上,该算法比单一粒子群算法花费的时间更少。
其他文献
伴随着经济发展和人们生活水平的提高,初中学校和家长在关注学生文化课成绩的同时也逐渐提升了对音乐、舞蹈、美术等艺术类学科的重视.针对这种现象,笔者结合多年指教经验,分
自从新的教学课程实施以来,传统的教学模式被取代,课堂教学效果的重要性在小学语文课堂教学中的要求不断提高.因此,新时代的语文教师,就要讲提高语文课堂效果作为教学理念,对
随着数字图像处理技术的发展,计算机视觉的缺陷检测技术成为了当今的热点问题。本文主要采用数字图像处理的理论研究了竹片图像的缺陷检测方法,分析了四种常用的缺陷检测算法
随着我国教育改革不断的深化与发展,其对于当前的教学工作提出了更高的要求.针对新课改提出的要求,大部分院校为了顺应教育的发展需要,对内进行积极的教学改革.因此,我国小学
前言 发热是临床疾病常见的一种伴随症状。一些细胞因子参与诱发产热和引起发热。白细胞介素-1β(Interleukin-1β,IL-1β)是目前公认的一种内生致热原,许多实验已经证明脑室
活跃的语文课堂气氛能有效地提高教学效率达到教学的目的.教师在课堂教学中,要以学生为主体,充分发挥学生的主体作用,激发他们的学习兴趣,调动学习积极性,真正做到教师只是课
在的背景下,丹麦一家企业Kommunekemi帮助编写了有关更安全地处理有害废物的最有效技术的欧盟参考文献.几年前Kommunekemi面临着环境影响和职业健康与安全问题.1990年代安装
随着信息技术的普及,微课已经应用到了各个学科教育中.小学语文作为小学教育中非常重要的基础科目,其教学质量已经成为了教育行业关注的重点内容.微课灵活多样,突破了传统教
新学期的统编小学语文教材创新无处不在,对语文教师的挑战也是无处不在,特别是中高年级,每个单元都有明确的语文要素.语文课是否变成一种纯粹的语文要素的训练呢?语文课是否
在小学阶段的教学中,小学语文教学是一门非常重要的基础课程,小学语文教学质量的高低,对学生语文能力与语文综合素养的发展有着至关重要的影响.著名思想大家让-雅克?卢梭曾说