文档介绍:第2章
数据仓库原理
1
数据仓库结构体系
数据仓库的数据模型
、转换和装载
元数据
2
数据仓库结构体系
数据仓库结构
数据仓库系统结构
数据仓库运行结构
3
近期基本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。
历史基本数据:近期基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据。
轻度综合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按数据属性(attributes)和内容(contents)进行综合。
高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。
数据仓库结构
4
5
数据仓库工作范围和成本常常是巨大的。开发数据仓库是代价很高、时间较长的大项目。
提供更紧密集成的数据集市就应运产生。
目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。
数据集市及其结构
6
数据集市(Data Marts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。
Data Marts是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。
7
(1)数据仓库是基于整个企业的数据模型建立的,它面向企业范围内的主题。而数据集市是按照某一特定部门的数据模型建立的。
(2)部门的主题与企业的主题之间可能存在关联,也可能不存在关联。
(3)数据集市的数据组织一般采用星型模型。
大型数据仓库的数据组织,如NCR公司采用第三范式。
8
1、规模是小的
2、特定的应用
3、面向部门
4、由业务部门定义,设计和开发
5、由业务部门管理和维护
6、快速实现
7、购买较便宜
8、投资快速回收
9、更详细的、预先存在的数据仓库的摘要子集
10、可升级到完整的数据仓库
9
独立数据集市(Independent Data Mart)
从属数据集市(Dependent Data Mart)
10