一种面向医学短文本的自适应聚类方法

来源 :东北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:q1q3q5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义.
其他文献
物理也是一门实验学科,没有实验就没有物理,从生活走向物理,从物理走向生活,物理本来就是一门源于生活的学科,当然,我们不光要注重实验教学,更重要的是使师生通过亲手制作实
辽宁本溪地区条带状铁矿(BIF)与其玄武质火山围岩之间的时空关联非常密切.对于玄武质火山围岩高场强元素(HFSE)的研究表明:wNb/wTa比值(7.00~19.93)表现出明显的分异,而wZr/wHf比值(33.46~38.28)则变化不大;从弓长岭到南芬、歪头山样品的wNb/wTa比值变化具有明显的循序性.这种高场强元素的迁移和分异特征反映出俯冲作用与盆地演化之间的关联.研究区玄武质火山围岩(
建设县级融媒体中心是现阶段加强和巩固新闻舆论阵地的首属要务,是提高基层媒体传播力、引导力、影响力的重要举措。先进技术是支撑县级融媒体中心建设的核心驱力,也是维持和
职业高中的很多学生初中时成绩就不好,没有养成良好的学习习惯,他们中的大多数人对学习都既没兴趣又没热情。这既与家长的教育有关,也与学生的成长环境有关。由于很多家长长
2011年11月7日,河北省藁城市徐村村民活动中心广场。二百多名徐村农民齐聚广场,以期盼的心情等待着农业技术专家的到来。石家庄市农广校“农民科技培训周”启动仪式将在这里举
在神经网络建模时,如果原始数据不加处理或经过简单剔除异常值后用于建模,则可能建立出错误的模型,即其规律并不符合物理冶金原理.因此建模前需要对原始数据进行处理,使其呈