基于互信息特征选择和权重分配的案例推理分类器

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ilovebaidoudou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
案例推理(case-based reasoning,CBR)是人工智能领域一种推理技术和机器学习方法。从认知科学的角度看,CBR模拟人的认知过程,其核心思想在于对新问题求解时,可以使用以前求解类似问题的经验来进行推理和学习,从而对问题的求解进行指导甚至直接重用结果,而不必从头做起。一般来说,CBR的研究内容主要涉及到案例的检索(Retrieve)、重用(Reuse)、修正(Revise)和存储(Retain),即4R认知推理模型。其中,特征选择及其权重分配会显著影响CBR的求解质量。由于特征选择方法还存在一些问题,比如粗糙集的泛化能力较差;遗传算法的算法复杂度较高;邻域粗糙集的邻域半径难以确定;基于互信息(mutual information,MI)的特征选择方法未考虑分类器的分类性能而导致特征选择后分类准确率下降。另外,特征变量的权重分配方法中,主观法过分依赖于领域专家经验;客观求解法中,比如遗传算法容易陷入局部极小;神经网络的结构难以确定。这些问题的存在使得CBR的求解质量还有待提高。因此,研究特征选择及其权重分配方法具有较重要的意义。本文以MI为方法基础,以提高CBR分类器的分类性能为目标,研究了一种基于MI的特征选择及其权重分配方法,取得如下结果:  (1)针对特征变量的有效选择问题,提出一种考虑分类性能的MI特征选择方法。首先,计算特征和类别之间的互信息大小,并定义相关的特征选择策略;然后,根据特征变量和类别变量之间的相关性以及特征变量所包含的分类信息定义特征冗余度和相关性;最后根据CBR的分类准确率制定评价准则得到特征子集。对比实验表明该特征选择方法能够准确删除冗余特征,有利于提高CBR的分类性能;  (2)针对特征权重的优化分配问题,利用互信息度量每个特征变量对CBR分类器的贡献度进而实现权重的合理分配。在此基础上,建立了一种基于互信息特征选择和权重分配的CBR分类器。该方法可以有效挖掘特征数据蕴含的分类信息,避免冗余特征对分类可靠性的不利影响,在降低时间复杂度的基础上,分类准确率得以提高;  (3)在实验成功的基础上,根据上述的CBR分类器设计了一个糖尿病的诊断系统。介绍了该系统的构成原理与每个模块的功能,并利用C#开发了辅助诊断系统,并从诊断的准确率、真阳率、假阳率等方面考察了本文方法的有效性。诊断结果进一步说明了本文所提出方法的有效性。
其他文献
情感研究是当前的一个热点,对人的情感和认知的研究是人工智能的高级阶段,研究人脑如何处理各种情感状态,对于探究人脑的运作机理有着十分重要的作用。脑电信号具有非线性特性,运
随着经济和科学技术的进步,社会信息化和数字化水平的日益提高,室内定位技术正向着数字化和全面化的方向发展。为了实现定位的便捷化与高精度化,本文在对现有室内定位技术分
风能是一种清洁的可再生能源,地球上的风能资源不仅蕴量丰富,而且分布范围广泛。当前,传统能源、电力紧缺及环境污染问题日益严重,开发利用风能等可再生能源成为世界能源可持续发展战略的重要组成部分,风力发电是当今新能源开发利用中技术成熟、最具备开发条件的项目。在风力发电中控制技术占有越来越重要的地位,本文以额定风速以上系统输出恒功率为目标,基于直驱型永磁同步风能转换系统对变桨距控制问题进行了研究。本文以系
本文针对环境探测,地面救援任务设计了一款具有机械手臂的履带式移动机器人,并对该机器人做了具体分析和性能实验验证。   首先,本文介绍了机器人的整体设计:包括底盘机械
间歇过程是现代流程工业中常见的一种生产方式,由于其本身具有的灵活性,被广泛应用于医药、食品、染料、生化制品等小批量、高附加值产品的生产和制备中。不同于一般的工业过
脑研究是目前科学领域的主要研究热点之一。随着神经电生理和成像技术的飞速发展,人们可以获取到大脑的各种数据。如何对这些数据进行有效的处理分析,对我们认识大脑、理解大
乙烯工业是石化行业的重要支柱,裂解炉是乙烯工业的关键设备和龙头。在当前乙烯市场的竞争日益激烈和各种不确定干扰因素并存的情况下,如何确保乙烯生产装置安全、高效、低能耗
计算机视觉的核心问题是三维重建问题,其中利用多视几何的方法估计射影空间中的空间点和直线的问题已经存在很多方法。但这些现存的方法中,有些没有注意到提取图像点和直线时
城市交通系统与人类社会活动息息相关,是城市繁荣、有序和高速发展的主要支撑条件,是科学研究的热点领域。在交通研究中,存在的一个主要问题是由于交通系统的复杂性本质、经济、
交通信息的实时监控及分析,对于增强城市快速路交通管理能力起到了越来越重要的作用。为了能够实时收集交通信息,基于视频的交通信息采集成为智能交通领域一个新的研究方向,具有