1 / 12
文档名称:

数据仓库的粗略发展历程.pdf

格式:pdf   大小:897KB   页数:12页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:Evaluation Warning : The document was created with Spire.PDF .

因此,在 90 年代初期,数据仓库的基本原理、框架架构,以及分析系统的主要原则都已经确定,主要的技术,包括关系型数据存取、网络、C/S 架构和图形化界面均已具备,只欠东风了。



同时,在 1988 年-1991 年,一些前沿的公司已经开始建立数据仓库。



1.2.3 企业级数据仓库(EDW,1991)

1991 年,Bill Inmon 出版了其有关数据仓库的第一本书,这本书不仅仅说明为什么要建数据仓

库、数据仓库能给你带来什么,更重要的是,Inmon 第一次提供了如何建设数据仓库的指导性

意见,该书定义了数据仓库非常具体的原则,包括:

 数据仓库是面向主题的(Subject-Oriented)、

 集成的(Integrated)、

 包含历史的(Time-variant)、

 不可更新的(Nonvolatile)、

 面向决策支持的(Decision Support)

 面向全企业的(Enterprise Scope)

 最明细的数据存储(Atomic Detail)

 数据快照式的数据获取(Snap Shot Capture)



这些原则到现在仍然是指导数据仓库建设的最基本原则,虽然中间的一些原则引发一些争论,

并导致一些分歧和数据仓库变体的产生。但是,Bill Inmon 凭借其这本书奠定了其在数据仓库建

设的位置,被称之为“数据仓库之父”。



1.2.4 数据集市(1994-1996)

数据仓库发展的第一明显分歧是数据集市概念的产生。由于企业级数据仓库的设计、实施很困

难,使得最早吃数据仓库螃蟹的公司遭到大面积的失败,因此数据仓库的建设者和分析师开始

考虑只建设企业级数据仓库的一部分,然后再逐步添加,但是这有背于Bill Inmon 的原则:各

个实施部分的数据抽取、清洗、转换和加载是独立,导致了数据的混乱与不一致性。而且部分实施的项目也有很多失败,除了常见的业务需求定义不清、项目执行不力之外,很重要的原因

是因为其数据模型设计,在企业级数据仓库中,Inmon 推荐采用 3 范式进行数据建模,但是不

排除其他的方法,但是 Inmon 的追随者固守 OLTP 系统的 3 范式设计,从而无法支持 DSS 系

统的性能和数据易访问性的要求。



这时,Ralph Kimball 出现了,他的第一本书“The DataWarehouse Toolkit”掀起了数据集市

的狂潮,这本书提供了如何为分析进行数据模型优化详细指导意见,从Dimensional Modeling

大行其道,也为传统的关系型数据模型和多维 OLAP 之间建立了很好的桥梁。从此,数据集市

在很多地方冒了出来,并获得很大成功,而企业级数据仓库已逐渐被人所淡忘。



1.2.5 争吵与混乱(1996-1997)

企业级数据仓库还是部门级数据集市?关系型还是多维?Bill Inmon 和 Ralph Kimball 一开始

就争论不休,其各自的追随者也唇舌相向,形成相对立的两派:Inmon 派和 Kimball 派(有点

象少林和武当,呵呵)。



在初期,数据集市的快速实施和较高的成功率让 Kimball 派占了上风,但是很快,他们也发现

自己陷入了某种困境:企业中存在 6-7 个不同的数据集市,分别有不同的 ETL,相互之间的

数据也不完全一致。同时,各个项目实施中也任意侵犯了Inmon 开始定下的准则:把数据集市

当成众多 OLTP 系统之后的有一个系统,而不是一个基础性的集成性的东西,为保证数据的准

确性和实时性,有的甚至可以

分享好友

预览全文

数据仓库的粗略发展历程.pdf

上传人:guoxiachuanyue002 2022/5/20 文件大小:897 KB

下载得到文件列表

数据仓库的粗略发展历程.pdf

相关文档