1 / 77
文档名称:

数据仓库培训.ppt

格式:ppt   大小:2,489KB   页数:77页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库培训.ppt

上传人:cjc201601 2017/8/29 文件大小:2.43 MB

下载得到文件列表

数据仓库培训.ppt

文档介绍

文档介绍:数据仓库与数据中心
内部知识培训
数据仓库与数据中心概述
OLTP 与 OLAP
多维数据分析模型
数据整合
应用介绍
数据仓库与数据中心概述
数据仓库的起因
数据库方式
数据仓库方式
数据与应用分离,以实现数据高度共享、支持日常业务处理过程为目的(OLTP)
以支持经营管理过程中的决策制定为目的(DSS,OLAP, DM)
20世纪90年代之前
20世纪90年代之后
什么是数据仓库
数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用于支持经营管理过程中的决策制定。
——
数据仓库与数据中心概述
数据仓库与数据中心概述
数据仓库的四个特征
数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用于支持经营管理过程中的决策制定。
——
数据仓库与数据中心概述
特征一面向主题
主题是用户使用数据仓库进行决策时所关心的重点方面,每一个主题基本对应一个宏观的分析领域。
如:> CRM
>>优质客户的挖掘
>>潜在大客户的发现
>>……
> ERP
>>合同管理
>>物资库存的管理
>>……
面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。
传统数据库中的数据是原始、基础数据,而特定分析领域数据则是需要对它们作必要的抽取、加工与总结而形成
数据仓库中的主题有时会因用户主观要求的变化而变化
数据仓库与数据中心概述
特征二集成
数据仓库中的数据是为分析服务的,而分析需要多种广泛的不同数据源以便进行比较、鉴别,因此数据仓库中的数据必须从多个数据源中获取,这些数据源包括多种类型数据库、网上数据等,它们通过数据集成而形成数据仓库中的数据。
统一消除不同数据源之间的数据不一致的现象
综合对原有数据进行综合和计算
数据仓库与数据中心概述
特征三不可更新
数据仓库中的数据是经过抽取而形成的分析型数据,不具有原始性,主要供企业决策分析之用,执行的主要是‘查询’操作,一般情况下不执行‘更新’操作。同时,一个稳定的数据环境也有利于数据分析操作和决策的制订。
需要更新的情况
进行新的决策时需要抽取和更新新的数据
通过删除丢弃一些过时的数据
数据仓库与数据中心概述
特征四随时间不断变化
数据仓库中的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点到目前的各个阶段的信息,通过这些信息可以对企业的发展历程和未来趋势作出定量分析和预测。
时间属性
数据仓库中的数据通常都带有时间属性
数据统一更新以时间段为单位
什么是数据中心
数据中心是公司一体化信息平台的重要组成部分。
数据仓库与数据中心概述
广义企业业务应用与数据资源进行集中、集成、共享、分析的场所、工具、流程等的有机组合
狭义应用层面的数据中心,具体包括数据仓库和建立在数据仓库之上的决策分析应用、数据ETL、ODS数据库、数据仓库、商务智能应用和元数据管理等