图挖掘技术研究及其在中医领域的应用

来源 :北京科技大学 | 被引量 : 0次 | 上传用户:ouerfadaide
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的实际应用的数据中,提取隐含在其中的、人们事先不知道的信息和知识的过程。它是信息技术未来的发展方向。本文依托于“十一五”国家科技支撑课题“基于认知的名老中医学术思想临床经验挖掘技术研究”和与中医院合作的“灵兰”中医知识搜索引擎系统,目的是挖掘出中医的诊断经验和用药规律。   本文介绍了论文的研究背景以及选题的意义。研究分析了论文相关的知识包括中医医案数据的特点、自然语言提取方法以及本体等,总结各种频繁子图的挖掘的算法,分析其存在的问题及解决的办法。之后设计和开发了中医方剂图挖掘系统。中医方剂图挖掘系统分为三个系统分别是中医方剂管理子系统、图结构生成子系统、核心方剂的挖掘及显示子系统。   中医方剂管理子系统对中医医案和方剂进行自然语言处理,将文本形式的医案进行中文分词、词性标注、建立分词词典等预处理操作,然后对处理过的数据进行概念提取和属性的匹配,本文通过中医的领域本体来匹配概念的属性。   图结构生成子系统根据经过预处理的中医药的数据,进行图结构的自动构建。系统实现三种构建方法,分别是基于概率的图模型构建,基于半边理论的图模型的构建及本文提出的综合了上述两种方法的综合(概率半边图构建)构建法。   核心方剂的挖掘及显示子系统使用gSpan算法实现了中医药核心方剂的挖掘,挖掘出了有效方剂的核心药物,并筛选出具有研究前景的基本药方组成,并应用可视化技术形象的展示出来。   最后,设计了三个测试对中医挖掘系统核心功能进行测试,以检验各个子系统的的运行结果和效率。
其他文献
现代软件企业面临着巨大的开发压力。在软件工程中,科学的软件度量可以在预研,开发和评估阶段提供数据支持。因此,软件度量是软件工程的必要环节。而在软件度量中,软件功能规模度
网格计算是近年来新兴的一种技术,它的目标是资源共享和分布协同工作。网格环境下的数据传输有带宽高、容量大等特点,但是目前这方面的研究并不多。人们对于网络带宽的需求日益
语义角色标注是目前语义分析的一种主要实现方式,它也是近年来自然语言处理领域的一个研究热点,是信息抽取、信息检索、阅读理解、问答系统等多种自然语言处理技术的重要基础
近年来,随着Web2.0技术的不断发展,博客空间已经成为一种社会大众广为接受的舆论交汇场所,一系列简单、独立的网络日志也因此逐渐发展为一种虚拟的社会形式——“博客群”。本文
自从第一款即时通讯软件ICQ诞生以来,即时通讯系统飞速发展,文件传输技术也同步发展。文件传输有很多种,常用的有FTP文件传输、HTTP文件传输、E-MAIL文件传输、共享式文件传输、
煤炭是一个特殊行业也是一个高危行业。煤矿安全管理是煤矿企业管理的一个十分重要的环节,煤矿安全管理的好坏,不但关系到煤矿企业的发展和前途,更加关系到每个矿井工作人员
性能是软件系统最重要的属性之一。如果系统无法达到预期性能,就要长时间进行调优,甚至导致项目最后以失败告终。目前,针对不同硬件体系结构,并行构件应用程序的执行性能可能差异
研究指出制造执行系统(MES)能有效消除信息孤岛,提高企业的生产效率,减少企业的生产成本,从而使企业在竞争激烈的市场占据优势。因而在企业实施信息化过程中,MES的实施至关重要。
中文分词是中文信息处理的基础,也是其一直存在的基本问题,有着极其广泛的实际应用。可以说,在各类中文信息处理软件(系统)中,中文分词是不可或缺的环节。自上个世纪末,由于互联网
随着互联网技术的快速发展和广泛应用,网络文化正以空前的广度和深度渗透到当代大学生学习与生活的方方面面。不良校园网络文化的传播严重威胁着大学生的价值取向、政治态度、