1 / 56
文档名称:

第六讲数据仓库.ppt

格式:ppt   大小:3,597KB   页数:56页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第六讲数据仓库.ppt

上传人:文库新人 2022/1/15 文件大小:3.51 MB

下载得到文件列表

第六讲数据仓库.ppt

相关文档

文档介绍

文档介绍:第六讲数据仓库
第一页,本课件共有56页
数据库处理的两大应用
联机事务处理(OLTP)
决策支持系统(DSS)
第二页,本课件共有56页
数据库处理的两大应用
联机事务处理(OLTP)
操作型处理,为企业的特定应用服务间间隔,对数据进行提取,是操作型数据的一个快照
第二十六页,本课件共有56页
数据仓库中的数据组织形式
连续
把新的快照追加到以前的连续数据上去
第二十七页,本课件共有56页
数据仓库的数据追加
数据追加
数据仓库的数据初装完成以后,再向数据仓库输入数据的过程称为数据追加
变化数据的捕获
时标法:加标识
DELTA法:对更新作记录
前后映象法:两次快照的对比
日志法:利用DBMS的日志,需改进
第二十八页,本课件共有56页
数据库的体系化环境
是在一个企业或组织内部,由各面向应用的OLTP数据库及各级面向主题的数据仓库所组成的完整的数据环境
操作型环境、分析型环境
四层体系化环境
操作型环境——OLTP
全局级——数据仓库
部门级——局部仓库
个人级——个人仓库,用于启发式的分析
数据集市(Data Mart)
特定的、面向部门的小型数据仓库
是为满足用户特定需求而创建的数据仓库
是数据仓库的子集
第二十九页,本课件共有56页
数据库的体系化环境
第三十页,本课件共有56页
数据库的体系化环境
第三十一页,本课件共有56页
数据仓库的开发生命周期
第三十二页,本课件共有56页
数据仓库的基本数据模式
星型模式(Star Schema)
事实表(fact table),存放基本数据,相关主题的数据主体(BCNF)
维(dimension),影响、分析主体数据的因素
量(measure),事实表中的数据属性
维表(dimension table),表示维的各种表
维是量的取值条件,维用外键表示
以事实表为中心,加上若干维表,组成星型数据模式
例:产品-商店-销售额
第三十三页,本课件共有56页
数据仓库的基本数据模式
CustSales
LocationSales
ProdSales
TimeSales
Sales
time id
<pk,fk>
product id
<pk,fk>
location id
<pk,fk>
customer id
<pk,fk>
sales revenue
units sold
Product
product id
<pk>
make
model
Time
time id
<pk>
date
year
quarter
month
week
Location
location id
<pk>
region
district
store
Customer
customer id
<pk>
category
group
Sales fact
Sales measures
Time dimension
Attributes of the time dimension
第三十四页,本课件共有56页
数据仓库的基本数据模式
雪花模式(Snowflake Schema)
维一般是由若干层次组成
把维按其层次结构表示成若干个表
规范化、节省存储空间
但需多做连接操作
第三十五页,本课件共有56页
数据仓库的解决方案
通用的关系数据库系统
专门的数据仓库服务器
第三十六页,本课件共有56页
数据仓库系统的体系结构
数据仓库层
数据仓库工具层
最终用户
第三十七页,本课件共有56页
数据仓库系统
数据仓库
居系统的核心地位
是信息挖掘的基础
数据仓库管理系统
是整个系统的引擎
负责管理整个系统的运转
数据仓库工具
一般的查询工具、功能强大的分析工具
是整个系统发挥作用的关键
第三十八页,本课件共有56页
数据分析模型
早期
静态数据值的相互比较
需求
从多个不同的数据源中综合数据
从不同的角度观察数据
多变的主题、多维数据
E-R不能完全支持
第三十九页,本课件共有56页
四种分析模型(Codd)
绝对模型
静态数据分析
只能对历史数据进行值的比较,描述基本事实
用户交互少
解释模型
思考模型
公式模型
第四十页,本课件共有56页
四种分析模型(Codd)
绝对模型
解释模型
静态数据分析
在当前多维视图的基础上找出事件发生的原因
思考模型
公式模型
第四十一页,本课件共有56页
四种分析模型(Codd)
绝对模型
解释模型
思考模型
动态数据分析
多维分析
在决策者的参与下,找出关键变量
需要高级数据分析人员的介入
公式模型
第四十二