文档介绍::.
第4章    数据仓库设计与开发 :Thedocumentwascreatedwi第4章    数据仓库设计与开发引例:沃尔玛的数据仓库
.,
这些数据主要包括各个商店前端设备(POS、扫描仪)采集
来的原始销售数据和各个商店的库存数。 
.Teradata数据库里存有196亿条记录,每天要处理并更新
2亿条记录,
进行处理。 
.销售数据、库存数据每天夜间从3000多个商店自动采集
过来,并通过卫星线路传到总部的数据仓库里。 
.沃尔玛数据仓库里最大的一张表格(Table)容量已超过
300GB、存有50亿条记录,可容纳65个星期3000多个商
店的销售数据,而每个商店有5万到8万个商品品种。 
.利用数据仓库技术,沃尔玛对商品进行市场类组分析,即
分析哪些商品顾客最有希望一起购买。思考:
.沃尔玛的数据仓库是怎样建成的?教学目标
.掌握
数据仓库的设计和开发方法
数据模型的设计
维度设计
粒度设计
数据仓库的开发步骤本章内容
  数据仓库的开发过程及特点
1. 数据仓库的开发过程
 2. 数据仓库的开发特点 
  数据模型设计 
1. 概念模型
2. 逻辑模型
3. 物理模型
4. 维度的设计
  数据仓库的粒度设计 
  
.按照生命周期发法可将数据仓库开发的全部过程
分成三个阶段。
(1) 数据仓库规划分析阶段。
(2) 数据仓库设计实施阶段。
(3) 数据仓库的使用维护阶段。
.这三个阶段不是简单的循环往复,而是不断完善
提高的过程。
一般情况下,数据仓库系统都不可能在一个循环过程
中完成,而是经过多次循环开发,每次循环都会给系
统增加新的功能,这种循环的工作永远不会终结,数
据仓库也就一直处于一个不断完善、不断提高的循环
过程中。数据仓库开发的生命周期数据仓库开发的生命周期 
1)DW规划分析阶段
.调查、分析DW环境;完成DW的开发规划;
确定DW开发需求。
.建立包括实体图、星型模型、雪花模型、
元数据模型及数据源分析的主题域数据模
型,并且根据主题域数据模型开发DW逻辑
模型。数据仓库开发的生命周期
2)DW设计实施阶段
.根据DW的逻辑模型设计DW体系结构;
.为DW中每个目标字段确定其在业务系统或
外部数据源中的数据来源;
.开发或购买用于抽取、清洗、转换和聚合
数据等中间件程序;
.将数据从数据源加载到DW,并且进行测试。数据仓库开发的生命周期
3)DW使用维护阶段
.投入使用,且在使用中改进、维护DW;
.对DW进行评价,为下一个循环开发提供依
据。:.
第4章    数据仓库设计与开发 :.
第4章    数据仓库设计与开发 :.
 引例:沃尔玛的数据仓库
,
这些数据主要包括各个商店前端设备(POS、扫描仪)采集
来的原始销售数据和各个商店的库存数。 
Teradata数据库里存有196亿条记录,每天要处理并更新
2亿条记录,
进行处理。 
销售数据、库存数据每天夜间从3000多个商店自动采集
过来,并通过卫星线路传到总部的数据仓库里。 
沃尔玛数据仓库里最大的一张表格(Table)容量已超过
300GB、存有50亿条记录,可容纳65个星期3000多个商
店的销售数据,而每个商店有5万到8万个商品品种。 
利用数据仓库技术,沃尔玛对商品进行市场类组分析,即
分析哪些商品顾客最有希望一起购买。 :.
第4章    数据仓库设计与开发 :