1 / 35
文档名称:

数据仓库体系结构.ppt

格式:ppt   大小:394KB   页数:35页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库体系结构.ppt

上传人:rovend 2021/12/19 文件大小:394 KB

下载得到文件列表

数据仓库体系结构.ppt

相关文档

文档介绍

文档介绍:第二章 数据仓库体系结构
一、数据仓库的定义
没有一个公认的、标准的定义
William :数据仓库是一个面向主题的、集成的、不同时间的、稳定的数据集合,它支持管理决策。
1、面向主题
主题〔Subject〕:特定的数据分析领域与目标。
面向主题:为特定的数据分析领域提供数据支持。
为特定数据分析领域提供的数据与传统数据库中的数据是有不同的。传统数据库中的数据是原始的、根底的数据,而特定分析领域数据那么是需要对它们作必要的抽取、加工与总结而形成。
数据仓库是面向分析、决策人员的主观要求的,不同的用户有不同的要求,同一个用户的要求也会随时间而经常变化,因此,数据仓库中的主题有时会因用户主观要求的变化而变化的。
例:一个面向事务处理的“商场〞数据库系统,其数据模式如下
采购子系统:
订单〔订单号,供给商号,总金额,日期〕
订单细那么〔订单号,商品号,类别,单价,数量〕
供给商〔供给商号,供给商名,地址, 〕
销售子系统:
顾客〔顾客号,姓名,性别,年龄,文化程度,地址, 〕
销售〔员工号,顾客号,商品号,数量,单价,日期〕
库存管理子系统:
领料单〔领料单号,领料人,商品号,数量,日期〕
进料单〔进料单号,订单号,进料人,收料人,日期〕
库存〔商品号,库房号,库存量,日期〕
库房〔库房号,仓库管理员,地点,库存商品描述〕
人事管理子系统:
员工〔员工号,姓名,性别,年龄,文化程度,部门号〕
部门〔部门号,部门名称,部门主管, 〕
上述数据模式根本上是按照企业内部的业务活动及其需要的相关数据来组织数据的存储的,没有实现真正的数据与应用别离,其抽象程度也不够高。
如果按照面向主题的方式进行数据组织,首先应该抽取主题,即按照管理人员的分析要求来确定主题,而与每个主题相关的数据又与有关的事务处理所需的数据不尽相同。
商品固有信息:商品号,商品名,类别,颜色等
商品采购信息:商品号,供给商号,供给价,供给日期,供给量等
商品销售信息:商品号,顾客号,售价,销售日期,销售量等
商品库存信息:商品号,库房号,库存量,日期等
主题一:商品
供给商固有信息:供给商号,供给商名,地址, 等
供给商品信息:供给商号,商品号,供给价,供给日期,供给量等
主题二:供给商
顾客固有信息:顾客号,顾客名,性别,年龄,文化程度,住址, 等
顾客购物信息:顾客号,商品号,售价,购置日期,购置量等
主题三:顾客
在每个主题中,都包含了有关该主题的所有信息,同时又抛弃了与分析处理无关或不需要的数据,从而将原本分散在各个子系统中的有关信息集中在一个主题中,形成有关该主题的一个完整一致的描述。面向主题的数据组织方式所强调的就是要形成一个这样一致的信息集合。
不同的主题之间也有重叠的内容,但这种重叠是逻辑上的,而不是物理存储上的重叠;是局部细节的重叠,而不是完全的重叠。
每个主题所需数据的物理存储:
多维数据库〔MDDB—Multi-Dimensional DataBase〕
用多维数组形式存储数据。
关系数据库
用一组关系来组织数据的存储,同一主题的一组关系都有一个公共的关键字,存放的也不是细节性的业务数据,而是经过一定程度的综合形成的综合性数据。