文档介绍:2018年4月21日
1 /93
二数据仓库
胡建军
广东商学院信息学院软件工程教研室
数据仓库与数据挖掘
教学目的、要求
1、熟悉数据仓库的相关概念
2、了解数据仓库的元数据组织与管理
3、掌握建立数据仓库的预处理技术
教学重点及难点
数据仓库的特点、元数据管理及建立数据仓库的预处理技术。
概念
W. H. Inmon 的定义
数据仓库是面向主题的、集成的、不可更新的(稳定性)随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。
2018年4月21日
4 /21
数据仓库的特点
集成性数据量大
只增加,不更改
面向主题
2018年4月21日
5 /21
2018年4月21日
6 /21
DW&DBMS??
数据更新
传统DBMS由于具有更新功能,为保证更新的并发执行的正确性,所以必须提供锁定、提交、检查点、封锁机制等安全机制。
数据更新是DBMS的一个常规部分,开销巨大,即使仅执行只读操作时,DBMS也至少要提供更新和锁定的开销,面DWMS不需要。
2018年4月21日
7 /21
对基本数据的管理
传统DBMS对数据在块级上的管理要包括一些附加空间,这些空间是用于以后更新和插入数据时块的扩展。自由空间可能约5%。
而DWMS没有更新和插入,所以不需要这些。
2018年4月21日
8 /21
索引
通用DBMS环境限制只允许有限数据的索引,这是因为当有数据更新和插入时,索引本身需要数据管理。
而对DW来说,由于没有数据更新,而是要求多种索引,以便对数据查询进行优化。
2018年4月21日
9 /21
管理能力和策略
传统DBMS在物理数据的组织上是为了数据安全、一致,优化事务的访问和处理。
而DW以优化方式组织数据是为了适应不同类型的访问能力(DW是多查询)。
2018年4月21日
10 /21