1 / 53
文档名称:

第二章 数据仓库.ppt

格式:ppt   大小:635KB   页数:53页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第二章 数据仓库.ppt

上传人:文库旗舰店 2018/6/30 文件大小:635 KB

下载得到文件列表

第二章 数据仓库.ppt

相关文档

文档介绍

文档介绍:第二章数据仓库
第2章数据仓库
数据仓库的体系结构
数据仓库系统的层次结构
数据集市
数据仓库构造模式
自顶向下模式
自底向上模式
数据仓库的技术要求
数据仓库的数据模型
概念模型
逻辑模型
物理模型
数据仓库数据组织
粒度
维度
元数据
数据分割
数据仓库的数据组织方式
数据仓库的数据存储组织
数据仓库的体系结构
一、数据仓库系统的层次结构
从数据仓库系统的总体结构看,数据仓库系统应该分为三个层次:数据获取/管理层、数据存储层、数据分析/应用层。
数据仓库的体系结构
数据分析
/
应用层
数据
获取
/
管理层
数据存储层
外部数据源

业务数据仓库
元数据
数据集市
数据仓库的体系结构

(1)数据仓库的定义与修改。定义数据仓库的数据来源、数据的组织方式,并根据决策的需要与环境的变化对这些内容进行修改,同时对数据仓库的元数据进行管理。
(2)数据的获取。根据已制定的规则,定期从指定的数据源中抽取源数据,并按规则对数据进行清洗、转换和集成,对数据仓库的内容定期进行校验和清理。
(3)数据仓库系统的管理。根据既定的规则和实际工作情况,实施数据仓库的维护、安全管理、备份、恢复和日志记录等工作。
数据仓库的体系结构

数据存储层是数据仓库的主体,存储的数据包括三部分:
(1)从外部数据源抽取并按主题组织存放的业务数据。
(2)数据仓库的元数据
(3)针对不同的数据挖掘和分析主题而生成的数据集市。
数据仓库的体系结构

满足用户的查询需要,并以适当的方式向用户展示查询、分析的结果。数据分析/应用层的主要包括以下功能。
(1) 查询/统计服务。为用户提供常规的查询检索、简单统计和报表等服务,这是数据仓库最基本的功能。
(2) OLAP服务。对于以多维数据库方式进行数据组织的数据仓库,OLAP是一种极为有效的分析方法,它通过上卷、下钻、切片、切块和旋转等操作,对多维数据库进行深入的分析。
(3) 数据挖掘服务。数据挖掘服务是数据仓库系统的一种深层次应用,它是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的、不为人们所知的、但又是十分有用的信息和知识的过程
二、数据集市
1、数据集市的类型
数据集市为部门及的数据仓库,可以分为两种,一种是独立数据集市,另一种是从属数据集市。
独立型数据集市属型数据集市的逻辑结构
2 数据集市
2、数据集市的特点
数据集市除具有数据仓库的基本特征以外,还具有以下特点:
(1)规模较小、灵活,可以按照多种方式来组织,如按特定的分析应用、部门、地域、主题等。
(2)开发工作一般由业务部门主持定义、设计、实施、管理和维护。
(3)能够快速实现,代价较低,投资回收期短,风险小。
(4)有利于进一步升级到完整的数据仓库或形成分布式数据仓库。