1 / 9
文档名称:

数据仓库工具箱 读书笔记.docx

格式:docx   大小:15KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库工具箱 读书笔记.docx

上传人:sunhongz2 2020/10/29 文件大小:15 KB

下载得到文件列表

数据仓库工具箱 读书笔记.docx

文档介绍

文档介绍:数据仓库工具箱_读书笔记《数据仓库工具箱—维度建模的完全指南》是数据仓库建模方面的经典著作,1996年第一版出版被认为是数据仓库方面具有里程碑意义的事件。作者 kimballl是数据仓库方面的权威,他将多年的数据仓库建模实战经验、技巧融入本书。他提出的许多维度建模概念被广泛应用于数据仓库的设计和开发中。2002年本书出版了第二版。这是一部非常好的数据仓库建模的书,前后完整的读了三遍,受益匪浅。以下笔记将本按四个部分组织:一、数据仓库体系结构和建模过程、技巧。二、维度表建模技术。三、事实表建模技术。四、行业建模经验。一、数据仓库体系结构和建模过程、技巧关键点:数据仓库体系结构、维度建模的四个步骤、数据仓库总线结构、一致性维度。1、对于数据仓库来说,业务需求是第一位的。2、数据仓库的目标:(1)、随心所欲的访问数据。直观、明显、简单、易用、切割、合并、下钻、上卷。(2)、一致的展现数据(相对于原来从多个系统中出来的报表不一致)。(3)、适应性、扩展性、可维护性。(4)、为领导决策提供支持。3、数据仓库的组成。源数据-->数据准备区-->数据仓库(维度建模)-->数-->展现。其中原系统到数据准备区属于 ETL过程。数据仓库据聚集区(OLAP)和数据聚集区本书称为数据展示。展现本书称为数据存取工具。4、数据仓库应特别注意的几点特点:(1)、数据应该以维度的形式进行展示、存储和访问。(2)、数据仓库中必须包含详细的原子数据。(3)、必须采用共同的维度和事实表来建模。5、数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵活性和可扩充性。6、维度建模的扩展性。表现在三个方面:(1)、在现有的事实表中增加维度。(2)、在事实表中增加事实。(3)、在维度表中增加属性。(第一章)7、维度模型设计的四个步骤。(1)、选取业务(主题)。(2)、定于业务处理的粒度。(3)、选择维度。(4)、选择事实。8、应优先为模型选择有原子性的信息,因为原子性的数据提供了最大限度的灵活性,可以接受任何可能形式的约束。(第二章)9、数据仓库总线结构。实际上是一种增量建模方式,通过一致性维度来集成数据中心。数据总线矩阵:业务处理、公共维度。一级数据中心:衍生于单个基本源系统的数据中心,建议从一级数据中心开始建模,因为导致失败的主要风险是ETL。合并数据中心:合并多个位于不同源系统的一级数据中心。(第三章)10、 维度建模复查。考虑的问题:粒度,日期维度,退化维度,维度属性采用名称而不是编码,代理关键字,维度的多少。11、 维度建模常犯的错误:(1)、舍弃一致性维度和一致性事实表。(2)、事实表的粒度不采用原子型。(3)、基于报表来设计维度表。(4)、不使用代理关键字。(5)、忽视维度的变化的需求。(6)、将体系与体系层次分解成多个维度。(7)、在维度表中为节省空间而限制使用详细的描述属性。(8)、在事实表中放置用于约束与分组操作的文本属性。(第十五章)12、 数据仓库成功的五个前提:(1)、拥有精明、强干的业务用户。用户应该对数据仓库具有独特的见解,坚信数据仓库项目具有实现的价值。(2)、机构必须存在建立数据仓库坚实而有说服力的业务动机。(3)、数据仓库的可用性。(4)、业务用户与IT人员之间的沟通。(5)、业务分析人员的分析文化,是基于图形、数据还是直觉、传闻和一时冲动。(第十