论文部分内容阅读
本文将统计分析技术引入到医疗领域,研制、开发了基于统计分析技术的疾病智能辅助诊断系统,其核心是文本分类技术。其中的关键技术有:文本分词、特征选取和分类算法,均列举了当前几种通用和较为成熟的做法。文本分词采用了当前较为成熟做法——基于字符串匹配与统计相结合的分词方法。特征选取是特征降维的主要方法,本文采用特征选取中的文档频度、信息增益和χ2-统计量三种方法进行实验。分类算法中详细地阐述了Bayes方法和MaximumEntropy方法。本文从原理和实验两个方面比较了各种做法的优劣,并选择了适合于疾病智能辅助诊断要求的方法构建了本系统。
同时,将本系统同医疗专家系统进行了比较,表明了本系统的特点。也分析了本系统目前存在的缺陷,这也指明了今后工作的方向。