1 / 133
文档名称:

3数据仓库开发模型.ppt

格式:ppt   大小:973KB   页数:133页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

3数据仓库开发模型.ppt

上传人:xunlai783 2018/2/8 文件大小:973 KB

下载得到文件列表

3数据仓库开发模型.ppt

相关文档

文档介绍

文档介绍:数据仓库与数据挖掘
蔡永明
**********
Sm_******@ujn.
第三章数据仓库开发模型
第三章数据仓库开发模型
模型:是对现实世界进行抽象的工具。在信息管理中需要将现实世界的事务及其有关特征转换为信息世界的数据才能对信息进行处理与管理。这就需要依靠数据模型作为这种转换的桥梁。
设计一个能够真正支持用户进行决策的决策分析数据仓库并非一件轻而易举的事情。需要经历一个从现实环境到抽象模型,从抽象模型到具体现实的过程。
现实的决策环境→概念数据模型→逻辑模型→物理模型→数据仓库(软件/程序)
第三章数据仓库开发模型
数据仓库开发上的困难
自顶向下的开发方法从全系统的角度提供解决方案,使得(模块)集成的问题最小;但是该方法十分昂贵,需要对组织进行长期研究和建模分析。
自底向上方法提供了更多的开发灵活性,价格便宜;但往往会遇到集成问题(每个模块单独运行都没有问题,但是一集成就出异常)
解决方法:
使用递增性、演化性的开发方法
高层数据模型企业仓库和数据集市并行开发通过分布式模型集成各数据集市多层数据仓库
提纲
一、数据仓库开发模型的概念
二、数据仓库的概念模型
三、数据仓库的逻辑模型
四、数据仓库的物理模型
五、数据仓库的生成
六、数据仓库的使用和维护
七、数据仓库的粒度、聚集和分割
八、元数据
一、数据仓库开发模型的概念
现实世界:是存在于现实之中的各种客观事物,它反映了客观事物及其相互之间的关系。
概念世界:是现实情况在人们头脑中的反映,人们需要利用一种模式将现实世界在自己的头脑中表达出来,便于相互交流。
逻辑世界:是人们为将存在于自己头脑中的概念模型转换到计算机中的实际物理存储过程中的一个计算机逻辑表示模式。
物理世界:是指现实世界中的事物在计算机系统中的实际存储模式,只有依靠这一物理存储模式,人们才能实现利用计算机对现实世界的信息管理。
1、四个世界:
6
一、数据仓库开发模型的概念
模型:是对现实世界进行抽象的工具。在信息管理中需要将现实世界的事务及其有关特征转换为信息世界的数据才能对信息进行处理与管理。这就需要依靠数据模型作为这种转换的桥梁。
2、模型
现实世界
信用
张三
客户
客户与产品
概念世界
特性
个体
整体
整体间联系
逻辑世界
属性
实体
同质总体
异质总体
物理世界
字段
记录
表文件
数据库
现实与不同模型的变化联系
7
应用需求
(数据、处理)
转换规则、
DBMS功能、
优化方法
需求收集和分析
设计概念结构
设计逻辑结构
数据模型优化
设计物理结构
评价设计,性能预测
物理实现
试验性运行
使用、维护数据库
应用要求,
DBMS详
细特征
需求分析阶段
概念设计阶段
逻辑设计阶段
物理设计阶段
数据库实施阶段
数据库运行、维护阶段
不满意
不满意
图3-1 数据仓库设计步骤
二、数据仓库的概念模型
数据仓库概念模型的设计是给出一个数据仓库的粗略蓝本,以此为设计图纸来确认数据仓库的设计者是否已经正确地了解数据仓库最终用户的决策信息需求。在概念模型的设计中,必须将注意力集中在对商务的理解上,要保证管理者的所有决策信息需要都被归纳进概念模型。
在构建数据仓库的概念模型时,可以采用在业务数据处理系统中经常应用的实体联系模型:E-R图
1、数据仓库的概念模型
9
二、数据仓库的概念模型
(1) 数据类型的差距
在数据仓库的概念模型中不包含操作型的数据,数据仓库的概念模型只包含用户所感兴趣的分析数据、描述数据和细节数据。
如商品的销售数量、企业的利润等是常见的分析数据;
销售时间、销售地点是用户感兴趣的描述数据;
所销售产品的详情、。
2、数据仓库的概念模型和数据库概念模型的区别
10