1 / 29
文档名称:

数据仓库与数据挖掘.ppt

格式:ppt   大小:1,334KB   页数:29页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘.ppt

上传人:孔乙己 2022/6/28 文件大小:1.30 MB

下载得到文件列表

数据仓库与数据挖掘.ppt

相关文档

文档介绍

文档介绍:数据仓库与数据挖掘
操作数据库与数据仓库的区别
操作数据库系统的主要任务是联机事务处理OLTP
数据仓库在数据分析和决策方面为用户提供服务,这种系统称为联机分析处理OLAP
基本数据模式
星型模式
日期维表
Ti供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。。
(4)信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。
OLAP基本操作
上卷操作:通过维层次,在数据立方体上进行聚集。
下钻操作:是上卷操作的逆操作,由不太详细的数据到更详细的数据。
切片和切块:切片在给定的数据立方体的一个维上进行选择,切块则是在两个或两个以上的维进行选择。
旋转操作:是改变维度的位置关系,使最终用户可以从其他视角来观察多维数据。
OLTP和OLAP的区别
用户和系统的面向性:
OLTP是面向顾客的,用于事务和查询处理;
OLAP是面向市场的,用于数据分析。
数据内容:
OLTP系统管理当前数据;
OLAP系统管理大量历史数据,提供汇总和聚集机制。
数据库设计:
OLTP采用实体-联系ER模型和面向应用的数据库设计;
OLAP采用星型或雪花模型和面向主题的数据库设计。
视图:
OLTP主要关注一个企业或部门内部的当前数据,不涉及历史数据或不同组织的数据;
OLAP则相反,不仅关注本企业或组织内部的当前数据,而且更多地涉及到历史数据和其他组织的数据。
访问模式:
OLTP系统的访问主要由短的原子事务组成,这种系统需要并行和恢复机制。
OLAP系统的访问大部分是只读操作。
OLTP和OLAP的区别(续)
OLAP的分析方法(一)切片、切块
OLAP的分析方法(二)钻取
按时间维向下钻取
按时间维向上钻取
60
OLAP的分析方法(三)旋转
OLAP服务器类型
关系OLAP(ROLAP)模型
 使用关系或扩充关系DBMS存放并管理数据仓库。
多维OLAP(MOLAP)服务器
 这些服务器通过基于数组的多维存储,支持数组的多维视图。
混合OLAP(HOLAP)服务器
 结合ROLAP和MOLAP技术,得宜于ROLAP的可伸缩性和MOLAP的快速计算。
数据组织形式
RDB数据组织 MDDB数据组织 关系表中综合数据的存放
多维数据库中综合数据的存放
产品名称
地区
销售量
冰箱
东北
50
冰箱
西北
60
冰箱
华北
100
彩电
东北
40
彩电
西北
70
彩电
华北
80
空调
东北
90
空调
西北
120
空调
华北
140
东北
西北
华北
冰箱
50
60
100
彩电
40
70
80
空调
90
120
140
产品名称
地区
销售量
冰箱
东北
50
冰箱
西北
60
冰箱
华北
100
冰箱
总和
210
彩电
东北
40
彩电
西北
70
彩电
华北
80
彩电
总和
190
空调
东北
90
空调
西北
120
空调
华北
140
空调
总和
350
总和
东北
180
总和
西北
250
总和
华北
320
总和
总和
750
东北
西北
华北
总和
冰箱
50
60
100
210
彩电
40
70
80
190
空调
90
120
140
350
总和
180
250
320
750
ROLAP体系结构
SQL
Result
Set
Info.
Request
Result
Set
Database Server
R
DBMS
Front-end Tool
ROALP Architecture
ROLAP Server
Metadata
Request
Processing
MOLAP体系结构
SQL
Result
Set
Info.
Request
Result
Set
Load
Database Server


RDBMS
Front-end Tool
MOALP Architecture
MOLAP Server
Metadata
Request
Processing
HOLAP体系结构