论文部分内容阅读
在医院的现代化管理中,病历作为医疗活动信息的主要载体,不仅是医疗、教学、科研的第一手资料.而且也是对医疗质量、技术水平、管理水平等进行综合评价的依据.欲在大量的医学文档中抽取符合一定条件的文档进行分析并总结(如研究某种疾病的易感人群的年龄段及地域分布等规律),对病历进行检索是必要途径之一.传统的检索工具,检索词通常采用机械匹配方式,对检索词的准确度要求较高而智能化程度较低,给检索用户带来了诸多的不便,大大影响了信息资源的利用效率.因此,建立一个具有智能性的检索系统就显得尤为重要.该文主要针对基于XML的电子病历的智能检索开展研究工作:(1)介绍了建立电子病历智能检索系统所依赖的理论知识,对XML及相关知识特别是XML DOM技术进行了深入的研究;详细地探讨了向量空间等数据检索模型;(2)该文在对XML语言及电子病历进行了深入研究的基础上主要对概念检索进行理论与技术上的尝试,智能化的概念检索突破了词语机械匹配式局限于表面形式的缺陷,从词所表达的概念意义层次上来认识和处理用户的检索请求,通过将信息检索与人工智能技术,特别是自然语言处理技术相结合,以概念网络(知识库)支持检索,提高了检索的智能化水平和检索的性能,从而克服了传统检索系统存在的弊端,在技术上具有可行性;(3)为了使后续的检索工作能够有足够的检索源(XML文档),设计了XML文档采集器;可对用户的查询请求进行自动分词;此外为了加快对用户检索要求的响应速度,对XML文档中的置标建立了索引;在知识库的构建过程中,建立了同义词典及蕴涵词典;利用知识库中的知识,可根据用户输入的检索词条进行同义检索及扩展检索;初步实现了对知识库的有效管理.