面向中医辨证的数据挖掘技术研究与应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:longyonghong520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展以及数据库管理系统的广泛应用,出现了数据爆炸但知识贫乏的现象,数据挖掘随之产生。它是一项通过对海量数掘进行提取、逻辑分析等处理操作来获得潜在有用的知识的技术,是目前国际上信息处理领域最前沿的研究方向之一。 我国的中医学有着悠久历史,中医学理论主要来源于对实践的总结,并在实践中不断得到充实和发展。中医辨证是中医学中的精华,是中医诊断学的主要研究内容,并为临床治疗提供依掘。目前的中医辨证还没有一个统一的规范标准,并且传统的统计学方法缺乏逻辑分析能力,所以辨证的客观真实性也是备受质疑。 本文讨论了以中医小儿肺炎病例数据为示范,将数据挖掘技术与中医辨证理论相结合来生成中医辨证规范的过程。首先,根据中医辨证方法和数据特点建立了中医辨证的五层结构,并转化成为数据挖掘模型。随后,根据这个挖掘模型对中医小儿肺炎病例这个高维空间数据集运用了相关的数据挖掘技术与方法,包括通过聚类挖掘得到证的分布及证的构成比,通过关联规则挖掘得到症状表现的关联关系和症状的贡献率。详细讨论了两个经典聚类算法,基于划分的K.平均算法和基于密度与网格的CLIOUE算法。其中K-平均算法根掘病例数据特点使用了两种不同的相似度计算函数,提高了挖掘结果的准确性。此外,在面向中医辨证的关联规则挖掘过程中提到一个基于产生频繁项集的方法Apriori算法,经实验分析表明,随着数据集维数的增加,在产生候选频繁项集的过程中,算法的执行效率急剧下降。于是在FP-growth算法的基础上提出了DFP-growth,该算法采用了一个类似FP-tree的树型结构,使用了压缩树的方法,简化了树的结构,提高了效率。最后,结合聚类挖掘和关联规则挖掘技术,展示了中医小儿肺炎辨证规范生成的一个详细过程。
其他文献
信息技术的快速发展为网络教学提供了广阔的前景。网络教学作为一种新的教学方法,改变了传统教学方式,提高了教学效果及学生参与教学活动的积极性。与传统的教学模式相比,网络教
在自然语言理解领域,词义消歧(Word Sense Disambiguation-WSD)是基础研究课题,也是重点和难点之一。作者在统计的框架下,多方面地考察词义消歧问题,得到了一些较好的结论,并在此
文件同步分为三个阶段。一是更新检测阶段,检测和发现文件的变化。二是同步决策阶段,决定如何进行文件同步,获得文件同步的具体步骤。三是同步实施阶段,进行具体的数据传输,完成文
面向奥运新闻机器翻译的中文分词研究与实现随着信息时代的到来,“信息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻
通信网络的信道是一个开放性信道,它在赋予用户通信自由的同时也给通信网络带来一些不安全性因素。伴随着VoIP的广泛使用,它在给用户带来廉价、方便、功能丰富的语音通信功能的
随着P2P计算模式的兴起和Internet端系统计算能力的迅速增强,原先被忽视的终端用户设备成为一种宝贵的资源。如何充分利用这些终端用户设备,在动态的P2P网络环境中对海量数据进
Internet搜索已经成为Web上最重要的应用之一,人们经常需要到Google、Baidu等搜索引擎去查找想要的信息,对于科研人员更是如此。为了开展研究,他们需要到网上查找相关的文献信息
声纹识别,也称说话人识别,它是通过对说话人的语音信号进行分析,而对说话人进行确认(Verification)或鉴别(Identification)的一种技术,已经在安全支付、声纹解锁、公安刑侦等许多
关键词检出是从连续语音中检测并确认给定的若干个特定词。它是连续语音识别的一个重要分支,有着广阔的应用前景,已成为近年来颇受重视的一个研究方向。传统的关键词检出系统一
随着Internet的发展,基于网络的应用系统越来越多,现代社会对网络的依赖日益增强,同时网络的安全也面临着巨大的挑战。面对威胁,众多安全机构研发了许多安全产品,但攻击者的