1 / 5
文档名称:

数据仓库 数据挖掘.docx

格式:docx   大小:39KB   页数:5页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库 数据挖掘.docx

上传人:碎碎念的折木 2022/6/30 文件大小:39 KB

下载得到文件列表

数据仓库 数据挖掘.docx

文档介绍

文档介绍:数据仓库
1.数据仓库概念解析
数据仓库之父 H·W·Inmon 是这样定义数据仓库的:数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员的决策。
数据仓库和数据库的区别:
是不一样的概念。数据的分析能力更加强大。例如:DSS 中的传统统计分析模型可以帮助用户对数据仓库中的数据进行更加有效、更加深入的分析,从而更好地掌握和利用信息。而一些智能决策技术,如人工神 经网络在发现顾客行为模式、预测金融市场行为等方面显示了强大的功能。这些 DSS 的核心技术在数据仓库中的应用,不但会大大提高数据仓库的决策支持能力,同时也使 DSS 的应用范围更加广泛。
数据挖掘
数据挖掘是当前业界的热门技术,已经在多个应用领域产生了巨大的效益。数据挖掘不一定
需要建立在数据仓库的基础上,但是如果将数据挖掘和数据仓库协同工作,则可以简化数据挖掘 过程的某些步骤,从而大大提高数据挖掘的工作效率。
数据仓库的体系结构如图 1 所示:
数据挖掘
图 1 数据仓库体系结构
一. 数据挖掘工具选择需要考虑的问题
1) 可产生的模式种类的数量:分类,聚类,关联等
解决复杂问题的能力
操作性能
数据存取能力
和其他产品的接口
二、数据挖掘工具介绍:

QUEST 是IBM 公司Almaden 研究中心开发的一个多任务数据挖掘系统, 目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点:
提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。
各种开采算法具有近似线性计算复杂度,可适用于任意大小的数据库。
算法具有找全性,即能将所有满足指定类型的模式全部寻找出来。

MineSet 是由SGI 公司和美国Standford 大学联合开发的多任务数据挖掘系统。MineSet 集成多种数据挖掘算法和可视化工具,帮助用户直观地、实时地发掘、理解大量数据背后的知识。MineSet 有如下特点:
MineSet 以先进的可视化显示方法闻名于世。
支持多种关系数据库。可以直接从Oracle、Informix、Sybase 的表读取数据,也可以通过 SQL 命令执行查询。
多种数据转换功能。在进行挖掘前,MineSet 可以去除不必要的数据项, 统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等。
操作简单、支持国际字符、可以直接发布到Web。

该系统设计的目的是把关系数据库和数据开采集成在一起,以面向属性的多级概念为基础发现各种知识。DBMiner 系统具有如下特色:
能完成多种知识的发现:泛化规则、特性规则、关联规则、分类规则、演化知识、偏离知识等。
综合了多种数据开采技术:面向属性的归纳、统计分析、逐级深化发现多级规则、元规则引导发现等方法。
提出了一种交互式的类 SQL 语言――数据开采查询语言 DMQL。
能与关系数据库平滑集成。
实现了基于客户/服务器体系结构的 Unix 和 PC(Windows