论文部分内容阅读
随着信息化程度的提升,很多国内医院都建立了自己的医院信息管理系统HIS。具体又可以划分为门诊系统、住院系统、电子病历系统、检查系统、药品管理系统、护理系统、财务管理系统、设备管理系统、查询系统和支持维护系统等。系统当中存储了海量关于医院运营所需的数据,如何能够从这些系统数据中得出管理人员所需要的信息,并不是一件轻易能够达成的事情。医院的管理系统多在查询、财务、药品管理、住院管理方面使用较多,并且只是一般的数据处理,真正对数据进行深层次利用较少。因而在医院提升信息化建设的同时,还需要实现对数据的关联使用和深层次挖掘分析,这样才能实现对数据的再加工,再应用,使得数据信息资源能够重复、充分利用,并从中获得增益。本文就是以HMIS系统的数据库为基础,结合医院的历史数据和长期积累下来的报表、报告等数据,根据医院特殊业务需求,制定了科室效率和效益管理这样一个主题,通过利用数据挖掘算法中的聚类分析技术,以7项指标为基础分析医院18个主要临床科室的现状,并为管理者制定有针对性的解决方案建议。本文所做的主要工作有:一、深入研究数据挖掘技术。1、数据预处理HMIS数据库的数据量较大,数据来源较多,很多低质量的数据,比如有噪声、缺失、不一致,会导致数据挖掘分析的结果失败。数据的预处理就是提高来源数据的质量,使得数据挖掘过程更加有效和更加方便。数据预处理的主要步骤有:数据清理、数据集成、数据归约和数据变换。2、数据仓库的研究和建立数据仓库是数据提取操作系统和作为历史快照即时查询和预定的报告,按照数据特征来组织数据仓库的数据。数据仓库模型创建过程:数据配置管理、数据仓库主题设计、数据的预处理、多维数据维度设计、事实表和维表设计,最后创建出医院的数据仓库模型。3、聚类算法聚类可以被认为是最重要的非监督学习问题,因此它涉及寻找结构无标号数据的集合。集群是一个对象集合,用于将具有相似特征的对象集合到同一组织中。本文研究的聚类算法有层次聚类、模糊聚类和K-Means算法。二、解析HMIS在医院应用中的作用和局限。三、构建医院数据仓库:以医院HMIS系统数据库数据和历史数据位基础,按照数据挖掘流程首先对数据执行预处理,数据配置管理、数据仓库主题设计、多维数据维度设计、事实表和维表设计,最后创建出医院的星型结构数据仓库模型。四、利用数据挖掘技术的三种聚类算法:模糊聚类、层次聚类和K-Means算法,确定了聚类分析的七个指标:患者三日确诊率、治愈率、患者住院时长、科室病床使用率、每个患者平均住院时间、诊疗药占比重、年收益。对医院18个临床科室进行聚类分析计算,并得到了预期的分类。针对聚类分析得出的五个分类的各自特点,本文为医院的管理决策者提出了针对性的解决方案建议,为医院的科学管理和科室效率、效益提高提供了有力的参考依据。