基于关联分析的TAN分类方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:lghlgh82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化程度的提高,数据量呈指数增长。从大量数据中快速有效地获得最有价值的信息资源在当今信息时代具有重要意义。其中,分类预测技术作为智能决策的重要手段将在未来的智能系统中发挥重要作用。本文主要对贝叶斯分类器中的TAN分类器进行研究,贝叶斯分类器作为其中重要的一类分类器同其他分类器相比具有如下特点:(1)贝叶斯分类器并不把一个对象绝对地指派给某一类,而是通过计算得出属于某一类的概率分布;(2)一般情况下在贝叶斯分类器中所有的属性都潜在地起作用,即并不是一个或者几个属性决定分类,而是所有的属性都参与分类;但其中也存在一些问题:1.使用朴素贝叶斯分类,是基于各个属性之间相互独立的假设之上的,从而忽略了属性之间的关系。2.使用TAN分类,需要将每个属性之间的关系进行计算,则有可能强加了一部分属性之间本就不强的联系。针对出现的问题,本文将关联分析和TAN分类结合起来,通过关联分析产生有效的关联规则并使用这些规则指导建立TAN分类器进行分类。在建立过程中因为引入了关联分析使得建立的模型介于朴素贝叶斯分类模型与TAN分类模型之间,有效的解决了属性之间要么完全没有关联要么关联过于“紧密”的情况。从而提出了使用关联分析结果指导建立‘TAN结构并进行分类的方法,即TANBA。   本文首先阐述了分类关联规则的有关概念,以及关联分类的方法和技术。其次,介绍了贝叶斯分类的相关知识和方法,特别重点介绍了TAN分类方法。之后,研究说明了基于关联分析的TAN算法(TANBA)及算法的关键技术,重点研究实现了基于Apriori改进的Apriori_DRM关联规则挖掘算法,以及基于关联规则的TAN结构构建算法。并对TANBA进行实验分析,将其应用于中医感冒方剂数据和真实世界的数据中,分析算法的分类效果及效率,同时对生成的贝叶斯分类模型进行分析,进一步的对算法的正确性和有效性进行分析和验证。
其他文献
演化计算是人工智能领域中的基于生物进化理论的一个分支。它模拟自然界生物演化过程,采用某种编码技术表示问题的可能解,并通过对编码表示进行遗传操作和自然选择来解决问题。
车辆路径问题是一个重要的物流优化课题,从1959年Dantzig提出至今,已经有50个年头,其间,出现了大量的变种和求解方法,这些问题和算法都默认一个事实,便是节点(车场或客户)间的权值(
随着GIS的社会化和广泛应用,社会上积累了大量分散的空间数据资源,而这些数据在数据结构、数据模型和数据格式等方面的差异导致大量GIS数据成果成为一系列信息孤岛,多源异构空间
工作流技术作为计算机支持的协同工作(Computer Suppoaed CooperativeWork,CSCW)领域的一项重要应用,在企业过程管理中发挥了重大作用。工作流管理系统(Workflow Management Sy
随着图形学理论、虚拟化技术和计算机硬件的飞速发展,GIS正在从二维向三维可视化和三维空间数据分析的方向发展。作为GIS应用的一个重要领域——“数字城市”,正经历着城市空间
近些年来,随着人类基因组计划的的完成、DNA微阵列技术的出现和应用使得人们可以同时定量测定成千上万个基因在生物样本中的表达水平,从而为用数学计算的方法研究基因之间的表
贝叶斯网络(Bayesian Network或BN)是人工智能领域进行建模和不确定性推理的一个有效工具。贝叶斯网推理的基本任务是:给定一组证据变量观察值,通过搜索条件概率表计算一组查询
数字病理图像具有分辨率高,图像的隐含结构复杂的特点,这给病理图像的智能判读带来了图像识别难,处理时间长的问题。本文设计了快速的病理图像处理流程,并且优化和设计了几个耗时
高压脉冲技术是电气领域的一个很有活力的分支,由于具有瞬时能量高、环保节能、副作用小和成本低廉的特点,随着产业技术的升级换代,它在食品、化学和环保行业有广阔的应用前景,于
随着模糊聚类分析技术和粗集理论的不断发展,模糊聚类分析技术和粗集理论已经在诸多领域获得了广泛的应用,其应用范围涉及到图像处理、计算机视觉、模式识别等相关领域。