文档介绍:摘 要
聚类分析算法在 HMIS 的应用
随着信息化程度的提升,很多国内医院都建立了自己的医院信息管理系统 HIS。具
体又可以划分为门诊系统、住院系统、电子病历系统、检查系统、药品管理系统、护理
系统、财务管理系统、设备管理系统、查询系统和支持维护系统等。系统当中存储了海
量关于医院运营所需的数据,如何能够从这些系统数据中得出管理人员所需要的信息,
并不是一件轻易能够达成的事情。
医院的管理系统多在查询、财务、药品管理、住院管理方面使用较多,并且只是一
般的数据处理,真正对数据进行深层次利用较少。因而在医院提升信息化建设的同时,
还需要实现对数据的关联使用和深层次挖掘分析,这样才能实现对数据的再加工,再应
用,使得数据信息资源能够重复、充分利用,并从中获得增益。
本文就是以 HMIS 系统的数据库为基础,结合医院的历史数据和长期积累下来的报
表、报告等数据,根据医院特殊业务需求,制定了科室效率和效益管理这样一个主题,
通过利用数据挖掘算法中的聚类分析技术,以 7 项指标为基础分析医院 18 个主要临床
科室的现状,并为管理者制定有针对性的解决方案建议。
本文所做的主要工作有:
一、深入研究数据挖掘技术。
1、数据预处理
HMIS 数据库的数据量较大,数据来源较多,很多低质量的数据,比如有噪声、缺
失、不一致,会导致数据挖掘分析的结果失败。数据的预处理就是提高来源数据的质量,
使得数据挖掘过程更加有效和更加方便。数据预处理的主要步骤有:数据清理、数据集
成、数据归约和数据变换。
2、数据仓库的研究和建立
数据仓库是数据提取操作系统和作为历史快照即时查询和预定的报告,按照数据特
征来组织数据仓库的数据。数据仓库模型创建过程:数据配置管理、数据仓库主题设计、
数据的预处理、多维数据维度设计、事实表和维表设计,最后创建出医院的数据仓库模
型。
3、聚类算法
聚类可以被认为是最重要的非监督学习问题,因此它涉及寻找结构无标号数据的集
合。集群是一个对象集合,用于将具有相似特征的对象集合到同一组织中。本文研究的
聚类算法有层次聚类、模糊聚类和 K-Means 算法。
I
二、解析 HMIS 在医院应用中的作用和局限。
三、构建医院数据仓库:以医院 HMIS 系统数据库数据和历史数据位基础,按照数
据挖掘流程首先对数据执行预处理,数据配置管理、数据仓库主题设计、多维数据维度
设计、事实表和维表设计,最后创建出医院的星型结构数据仓库模型。
四、利用数据挖掘技术的三种聚类算法:模糊聚类、层次聚类和 K-Means 算法,确
定了聚类分析的七个指标:患者三日确诊率、治愈率、患者住院时长、科室病床使用率、
每个患者平均住院时间、诊疗药占比重、年收益。对医院 18 个临床科室进行聚类分析
计算,并得到了预期的分类。
针对聚类分析得出的五个分类的各自特点,本文为医院的管理决策者提出了针对性
的解决方案建议,为医院的科学管理和科室效率、效益提高提供了有力的参考依据。
关键词:
聚类分析,数据仓库,多维数据模型,数据预处理,医院数据挖掘
II
ABSTRACT
The Application of Cluster Analysis Algorithm in HMIS
As the informationization level of ascension, many domestic hospitals have set up
hospital information management system. Concrete can be divided into again, be in hospital
outpatient service system, the electronic medical rec