基于代价敏感的分类研究

来源 :漳州师范学院 | 被引量 : 0次 | 上传用户:pamfdpv007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代价敏感学习是一种新的分类学习,其目标是以获得最小测试代价和误分类代价来建立分类器。本文主要对测试代价敏感学习进行研究。测试代价敏感属性约简的目标是获得最小测试代价的约简。测试代价有限是指所能花费的最大测试代价大于最小测试代价但不大于总测试代价。对于测试代价有限的分类问题,其目标是在测试代价有限的条件下,选择更多的重要属性来保证分类的准确率。而最小测试代价约简只保留了简洁的系统信息,导致分类的准确率有所降低。针对测试代价有限的分类问题,本文主要研究以下几个方面。  首先,最小测试代价约简研究,从而得出最小的测试代价。本文提出了一种基于遗传算法的测试代价属性约简算法来求解最小测试代价约简。实验结果表明,该算法在中小数据集上可以有效地找到最小测试代价约简。  其次,带有测试代价约束的最优子约简问题研究。测试代价约束是指所能花费的最大测试代价小于最小测试代价。这意味着,在测试代价约束的条件下,只能求解能够最大程度保留系统信息的子约简。本文针对带有公共测试代价敏感决策系统的最优子约简问题设计了一个启发式算法,实验结果总体上令人满意。  第三,分类研究。分类准确率是分类技术的重要评价指标之一。本文主要对决策树(ID3)进行改进研究,提出两种不同的改进决策树。实验结果表明,这两种改进的决策树的分类准确率总体上都比ID3高。  最后,基于测试代价有限的分类问题研究。测试代价有限的属性选择至关重要,不同属性的组合,构建的分类器质量不尽相同。本文提出了两种不同的测试代价有限的属性集选择算法,并将改进的决策树分别应用于构建分类器。实验结果表明,测试代价有限的条件下,选择更多的好属性有利于保持分类准确率。同时,本文的属性集选择算法在一些数据集中可以大幅减少地测试代价。
其他文献
偏微分方程是图像处理的主流方法之一,基于偏微分方程的图像修复模型可以较好地对非纹理图像进行修复。Euler弹性修复模型通过引入Euler弹性项,采用光滑的曲线对图像进行修复
身份安全问题是现代社会的一个重要话题,传统的身份识别手段己跟不上现代社会的步伐,新兴的生物特征识别技术依靠其独特的优势越来越受到广大使用者的欢迎。在众多生物特征识别
SNS (Social Network Site),即社交网站。近几年,网络上掀起了一股社交网站的风潮,由于国内社交网站发展较晚,是借鉴外国Facebook的模式发展起来的,所以在发展的同时也带来了
近年来,机器翻译技术的快速发展从很大程度上得益于自动评价方法的研究,但是它同样也受到了评价方法性能的制约。在分析已有方法优缺点的基础上,本文提出了一种新的评价方法,并且
基于证书公钥密码学是Gentry在2003年欧洲密码学会上提出的,它结合了传统公钥密码学和基于身份密码学的优点,但既克服了传统公钥密码学中的证书管理问题,又解决了基于身份公钥密
钩虫、蛔虫、血吸虫、绦虫等是人体常见的寄生虫,及时准确的发现人体中的寄生虫种类是防治寄生虫病的关键,以往人工检测的方式操作繁琐,效率低下,很快便转向依靠计算机技术辅助完
密钥隔离技术作为减少密钥泄露危害的重要方法之一,主要思想是定期对签名密钥进行更新,增强方案抵御密钥泄露危害的能力。密钥隔离机制作为密钥演化机制的一种重要分支,是密
智能视频监控是计算机视觉领域中的研究热点之一,它利用计算机技术实现视频内容的自动分析,目的是使机器视觉具有和人眼一样的感知功能。作为一种安防手段,智能视频监控已经被广
高级在轨系统AOS是国际空间数据系统咨询委员会CCSDS制定的一套满足复杂任务航天器多类型、高速率数据传输需求的空间链路通信体制建议标准,已被航天技术发达国家所广泛采用
目前我国教育网的发展蒸蒸日上。以清华大学校园网为代表的全国十所高校作为教育网的校园级网络正在全力的发展教育网中P2P技术的应用,尤其以Maze和6维空间为大家所熟知。P2P