论文部分内容阅读
目的:中医药数据多以文献信息为主,但常因地域、时代、编者认识及表述习惯的不同,普遍存在着同一个概念的表述不一致现象,这对本研究所源于的福建省科技计划重点项目(编号:2006Y0016)中建成的“中药信息系统”内数据的充分利用设置了重重障碍。因此,如何统一和规范中药信息系统中的原始数据便成为迫切需要解决的问题。基于此,本研究开展了中药信息系统中药主治信息的术语规范化研究和应用。中药主治信息涉及病名、证候名、症状体征三个方面,而当前中医病名正遭遇着濒临“取消”的尴尬,这可能与中医疾病理论体系的不完善和中医疾病诊断标准的不明确有着直接的关系。此外,标准的中医证候名中涉及的基本术语(即证素术语)仅60余个,为缩小术语范围、简化研究对象、解决证的相兼问题等,本研究对中药主治信息中的证素术语和症状术语进行规范化。方法:经文献调研,本研究分别选择《证素辨证学》、《常见症状中医鉴别诊疗学》及《中医临床诊疗术语——证候部分》中含有的证素术语作为数据源和《中医临床常见症状术语规范》、《常见症状中医鉴别诊疗学》、《中医临床诊疗术语——证候部分、疾病部分》中的症状术语作为数据源,经过词频统计、数据预处理、概念分层、专家咨询等方法,设计字段并分别构建“证素术语体系数据库”、“症状术语体系数据库”。结果:运用数据预处理技术对原始数据进行数据变换与数据集成、同义词处理和概念层次处理,完善两个术语体系中的语义关系。最后选取《药典2005版》中药主治字段中数据进行规范化处理,实验结果显示:利用建成的两个术语体系库作为后台,分别有96%和97.3%药典中的记录自动进行了术语匹配;仅利用术语库进行术语匹配与增加了人工判断纠错后的术语匹配结果之间的比值分别为证素术语54.4%、症状术语的68.2%。结论:采用数据预处理技术,选择权威术语源,建立规范的“证素术语体系数据库”和“症状术语体系数据库”,并对《药典2005版》主治信息开展术语规范化应用,最终实验结果显示数据预处理技术能很好地应用于中药主治信息的术语规范化研究中,并确保产生的中药主治数据科学、可靠,为后期的数据分析和挖掘研究提供科学、权威的数据支持。