【摘 要】
:
粗糙集理论是Z. Pawlak于1982年提出的一种数据挖掘新方法,已成功应用于特征选择、模式识别、机器学习、决策分析等领域.基于粗糙集技术的数据挖掘是通过属性约简来实现的,属
论文部分内容阅读
粗糙集理论是Z. Pawlak于1982年提出的一种数据挖掘新方法,已成功应用于特征选择、模式识别、机器学习、决策分析等领域.基于粗糙集技术的数据挖掘是通过属性约简来实现的,属性约简算法可粗略地分为三类:前向属性约简算法、后向属性约简算法和其他属性约简算法(如基于区分矩阵的属性约简算法).前向属性约简方法得到的约简大多都存在冗余属性,本文对HORAFA属性约简算法进行改进,提出了一种新的基于差别矩阵的前向选择算法,首先删除区分矩阵中属性重要性最小的属性,然后选择只包含一个属性的矩阵元素,并将其加入到属性约简集合中,确保最终得到一个不存在冗余属性的约简.对于后向属性约简方法,通过分析删除待删属性后得到的等价类的性质,提出了一种以划分基数为停止基准的后向属性约简算法,运用该算法可以得到更少的决策规则.通过分析集合覆盖的性质,对集合覆盖的概念进行了扩展,提出了新的集合覆盖概念,并将其应用到基于区分矩阵的属性约简算法.针对前向属性约简算法在添加新属性后,前续结果需重复计算的问题,提出了一种递归计算方法.在区分矩阵的建立过程中,利用决策属性首先对实例集合进行划分,然后再建立区分矩阵,提高了建立区分矩阵的效率.
其他文献
在所有生物特征里面,人脸特征是最普遍和是容易获取的。所以,人脸识别一直都是模式识别和图像处理领域最热门的课题之一。本文主要研究了基于主元分析及fisher准则的三维人脸
随着计算机科学技术的飞速发展,数据挖掘技术成为数据库、数据仓库领域最前沿的研究方向之一,它作为信息科学领域的前沿研究课题之一,是解决数据丰富而知识贫乏的有效途径,关
随着计算机技术的快速发展,到21世纪,嵌入式技术正进入充满机遇的阶段,嵌入式操作系统也逐渐壮大和成熟,已经被广泛应用到各个领域中,包括从小型手持设备(电子表、PDA和MP3播
三维地形的实时绘制技术是虚拟环境、地理信息系统以及军事仿真应用中的重要组成部分。由于表示地形的三角形数量大和硬件能力的限制,绘制不能达到实时。构建地形的多分辨率
聚类作为数据挖掘的一个重要领域,近年来倍受人们的关注。它能够作为一个独立的分析工具获得数据的分布情况,观察每一类数据的特征,集中对特定的聚类集合作进一步地分析。聚类技
今年,随着美国金融危机给全球经济带来的影响进一步扩展,我国经济也受到严重的冲击,尤其是我国银行业必须得面对严峻考验,提高银行的信誉和形象,以面对金融危机的全球化带来
近年来,随着自然语言处理技术的发展和大规模语料库的出现,各类自然语言应用中使用的语言模型规模也越来越大。机器翻译是大规模语言模型的主要应用领域之一,语言模型有助于
AODV路由协议即按需距离矢量路由协议,是移动Ad Hoc网络中使用最广泛的一种按需路由协议。AODV路由协议具有算法实现简单,分组中不需要包含整条路由信息等优点。该协议使用跳
算法作曲是人工智能领域中一个研究方向,而为旋律配伴奏是其中一个十分具有挑战性和现实意义的研究分支。本文把旋律配和声看作是类似机器学习的一项任务,通过对于一系列样本