论文部分内容阅读
中医学作为中国特色的传统医学具有重要的社会价值,然而中医知识体系的复杂结构使得中医传承在知识共享、知识交换以及知识融合等方面存在较大的障碍。而中医医案记录了中医诊疗过程中的临床思维活动和辨证论治过程,尤其是那些具有丰富临床经验的名老中医的医案,更是中医理论方药综合应用的具体反映形式,更能反映中医学的特点。因而可以能过研究这些名老中医的医案,对其进行知识获取,就可以很好的掌握中医学的特点和规律,掌握这些名老中医的辨证论治过程,对中国中医学的传承有着积极的作用。
然而面对海量的医案,如果采用纯手工填写结构化的采集模板来结构化医案信息,则要耗费大量的人力物力,也反映不了各个名老中医的辨证思路。因此必须通过计算机技术对医案信息进行自动结构化的机器学习,通过分析中医医案自身的特点,结合自然语言处理技术在文本信息处理方面的优势,本文采用中文分词技术及信息提取技术对中医医案进行结构化处理,为下一步数据挖掘知识获取做好准备。
中医辨证在中医理论体系中占有非常重要的地位,而中医医案信息中的证型和方药都是中医辨证论治中的重要环节,是中医知识获取的热点研究对象,本文主要通过数据挖掘中改进的关联规则算法和贝叶斯网络,挖掘出证型和症状,证型和方药的关系。挖掘出方药的配伍情况,并做配伍后的性味归经统计。最终本文作者利用知识获取后的数据设计了中医医案的专业搜索工具:灵兰搜索。
本文包含了从中医原始医案数据结构化处理到数据挖掘进行中医知识获取的整个过程,课题涉及的关键技术有:自然语言处理、信息提取、数据挖掘中的贝叶斯网和关联规则以及知识获取。最终形成的搜索工具得到了中医领域权威专家的认可并具有一定的推广价值。