1 / 12
文档名称:

数据仓库的粗略发展历程.pdf

格式:pdf   大小:897KB   页数:12页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库的粗略发展历程.pdf

上传人:guoxiachuanyue002 2022/5/20 文件大小:897 KB

下载得到文件列表

数据仓库的粗略发展历程.pdf

文档介绍

文档介绍:: .

因此,在 90 年代初期,数据仓库的基本原理、框架架构,以及分析系统的主要原则都已经确定,主要的技术,包括关系型数据存取、网络、C/S 架构和图形化界面均已具备,只欠东风了。
同时,在 1988 年-1991 年,一些前沿的公司已经开始建立数据仓库。
企业级数据仓库(EDW,1991)
1991 年,Bill Inmon 出版了其有关数据仓库的第一本书,这本书不仅仅说明为什么要建数据仓
库、数据仓库能给你带来什么,更重要的是,Inmon 第一次提供了如何建设数据仓库的指导性
意见,该书定义了数据仓库非常具体的原则,包括:
 数据仓库是面向主题的(Subject-Oriented)、
 集成的(Integrated)、
 包含历史的(Time-variant)、
 不可更新的(Nonvolatile)、
 面向决策支持的(Decision Support)
 面向全企业的(Enterprise Scope)
 最明细的数据存储(Atomic Detail)
 数据快照式的数据获取(Snap Shot Capture)
这些原则到现在仍然是指导数据仓库建设的最基本原则,虽然中间的一些原则引发一些争论,
并导致一些分歧和数据仓库变体的产生。但是,Bill Inmon 凭借其这本书奠定了其在数据仓库建
设的位置,被称之为“数据仓库之父”。
数据集市(1994-1996)
数据仓库发展的第一明显分歧是数据集市概念的产生。由于企业级数据仓库的设计、实施很困
难,使得最早吃数据仓库螃蟹的公司遭到大面积的失败,因此数据仓库的建设者和分析师开始
考虑只建设企业级数据仓库的一部分,然后再逐步添加,但是这有背于Bill Inmon 的原则:各
个实施部分的数据抽取、清洗、转换和加载是独立,导致了数据的混乱与不一致性。而且部分实施的项目也有很多失败,除了常见的业务需求定义不清、项目执行不力之外,很重要的原因
是因为其数据模型设计,在企业级数据仓库中,Inmon 推荐采用 3 范式进行数据建模,但是不
排除其他的方法,但是 Inmon 的追随者固守 OLTP 系统的 3 范式设计,从而无法支持 DSS 系
统的性能和数据易访问性的要求。
这时,Ralph Kimball 出现了,他的第一本书“The DataWarehouse Toolkit”掀起了数据集市
的狂潮,这本书提供了如何为分析进行数据模型优化详细指导意见,从Dimensional Modeling
大行其道,也为传统的关系型数据模型和多维 OLAP 之间建立了很好的桥梁。从此,数据集市
在很多地方冒了出来,并获得很大成功,而企业级数据仓库已逐渐被人所淡忘。
争吵与混乱(1996-1997)
企业级数据仓库还是部门级数据集市?关系型还是多维?Bill Inmon 和 Ralph Kimball 一开始
就争论不休,其各自的追随者也唇舌相向,形成相对立的两派:Inmon 派和 Kimball 派(有点
象少林和武当,呵呵)。
在初期,数据集市的快速实施和较高的成功率让 Kimball 派占了上风,但是很快,他们也发现
自己陷入了某种困境:企业中存在 6-7 个不同的数据集市,分别有不同的 ETL,相互之间的
数据也不完全一致。同时,各个项目实施中也任意侵犯了Inmon 开始定下的准则:把数据集市
当成众多 OLTP 系统之后的有一个系统,而不是一个基础性的集成性的东西,为保证数据的准
确性和实时

最近更新