文档介绍:第二章数据仓库多维数据模型
数据立方体
多维数据库模式
多维数据模型的OLAP操作
数据仓库设计步骤
1
数据立方体
数据模型的构造是DW建设中最关键的一步,它决定了DW所能进行的分析的类型、分析的细致程度、分析的效率及响应时间。
主流的DW建模技术之一是维度建模,其基础就是多维数据模型
多维数据模型将数据看作数据立方体形式
2
数据立方体
传统数据模型作为数据仓库的设计基础,在实际应用中存在许多缺点。
【例】对一个简单的数据模型,根据数据仓库建立实体时载入的数据量,考虑数据仓库中数据的一种三维***。
3
客户
订单
产品
供应商
发货
一个简单的数据模型给人的印象是所有的实体都是等同的
实体的三维***表现出实体并不是平等的,有些实体包含的数据远远超过其他实体
供应商
发货
产品
客户
订单
4
数据立方体-由表到数据立方体
代表供应商、客户、产品、发货实体的表中载入的数据量相对较少,而代表订单实体的表中却要载入大量的数据,因此需要一种不同的设计处理方式。
用来管理数据仓库中载入某个实体的大量数据的设计结构被称为“星型连接”。
5
订单号订单日期
订单数量
供应商号
…
客户号
…
发货单号
…
产品号
…
供应商号
…
…
客户号
…
…
发货单号
…
…
产品号
…
…
事实表
维表
维表
6
数据立方体-由表到数据立方体
在实际决策过程中,决策者往往希望能从多个角度观察某个指标或多个指标的值,并且找出这些指标之间的关系,我们将这些观察数据的角度称为维。可以说决策数据是多维数据,多维数据分析是决策的主要内容。
【例】一个比较有代表性的问题:需要知道东部地区和西部地区今年6月和去年6月在销售总额上的对比情况,并且销售额按10-20 万,20-30 万,30-40 万,40 万以上分组。
决策者所需的数据总是与一些统计指标、观察角度、不同级别的统计有关。
7
数据立方体-由表到数据立方体
数据立方体允许以多维对数据建模和观察,它由维与事实定义。
维:观察数据的特定角度。每一个维都有一个表与之相关联,称为维表,用来进一步描述维。
多维数据模型通常围绕中心主题组织,该主题用事实表表示。
事实表:事实的名称或数字度量值以及每个相关维表的关键字。
8
数据立方体-由表到数据立方体
通常认为数据立方体是三维几何结构,在数据仓库中,数据立方体是N 维(N-D)的。
考察一个2-D数据立方体(实际上是一张某电子公司的销售数据表)。特别观察公司在南京的所有分店每季度销售的商品情况。
9
数据立方体-由表到数据立方体
销售数据按照时间、类型的2-D视图,南京的销售用维时间和维类型表示,所显示的事实或度量是销售额(万元)。
产品类型
家庭娱乐
计算机
电话
安全
Q1
Q2
Q3
Q4
605
680
812
927
1023
1038
952
825
14
31
30
38
400
512
501
580
时间
(季度)
10