文档介绍:第 26 卷第 5 期华中理工大学学报 V o l. 26 N o. 5
1998 年 5 月 J. H uazhong U niv. of Sci. & T ech. M ay 1998
E IS 环境下的数据挖掘技术的研究3
高波陈学广费奇
(华中理工大学系统工程研究所)
摘要从数据挖掘的一般性定义入手, 给出了 E IS 环境下数据挖掘的概念和过程. 并根据 E IS 和数据挖掘
各自的特点, 以概念树算法和决策树算法为例, 在分析了它们的算法原理的基础上, 探讨了通过属性值间概念
存在的层次关系实现 E IS 数据查询的逐级细化; 根据信息论原理, 以分类学习为基础, 通过计算各属性所含
信息量大小, 得出判断规则, 为 E IS 辅助决策提供支持.
关键词高层管理信息系统; 数据挖掘; 知识发现; 概念树; 决策树
分类号 N 94
E IS 即高层管理信息系统, 是继M IS 和D SS E IS 的组织目标是 E IS 系统的核心, 同样也
之后管理信息系统的又一重要成员, 其主要目标是 E IS 环境下数据挖掘的核心. 在这里, E IS 的组
是以最友善的手段提供给决策者最需要的信织目标可以表现为具体的关键成功因子, 也可以
息[1 ]. 数据挖掘技术在 E IS 中的运用将有利于该是一个总的指导思想. 在追踪、预测或评价它的过
目标的实现. 程中产生相应的发现任务.
发现任务结合决策者的实践经验和系统积累
1 E IS 环境下数据挖掘的概念提供的领域知识、数据字典, 用适当的方式从数据
库(数据源) 中产生将作为数据发掘对象的视
1. 1 数据挖掘的定义图, 即数据基. 这一步叫做数据的汇聚.
数据挖掘又称数据库中的知识发现. 它产生对于数据基中存在的与当前挖掘过程无关的
于 80 年代初, 是人工智能、机器学习与数据库技属性, 或是存在冗余或空值等现象, 或是不符合算
术相结合的产物. 定义如下[2 ]: 数据挖掘过程就是法要求等等, 在预处理中都要加以考虑.
从数据中提取有效模式的非平凡过程, 并且该模模式提取是一个挑选算法、确定参数并加以
式是新的、潜在有用的和最终可理解的, 其中非平实施的过程, 是数据挖掘的核心步骤. 它的输出称
凡过程是针对能以确定的计算过程提取模式的平为模式, 其实质是对数据库元素间关系的一种描
凡过程而言的. 述. 具体来说有依赖关系、分类识别、聚类识别、偏
1. 2 E IS 环境下数据挖掘的一般过程差检测等模式.
数据挖掘并不是完全自动地从数据库中存储通过对模式的解释和评价形成知识, 知识的
的大量数据中发掘出所有存在的知识. 实际上的表现形式可以多种多样, 比如公式、图表、自然语
数据发掘过程是大量人机交互的过程. Ronald J. 言等等.
B rachm an 和 T ej A nand 专门撰文强调数据挖掘还应该注意到, 在整个挖掘过程中, 系统的组
过程中必须以人为中心[2 ]. E IS 环境下的数据挖织目标始终处于核心地位. 它通过发现任务, 结合
掘工作必须以高层管理者为中心, 结合他们丰富领域知识、数据字典及决策者的实践经验, 指导着
的领域知识和实践经验, 指导发掘过程. 从数