1 / 12
文档名称:

数据仓库技术.ppt

格式:ppt   大小:167KB   页数:12页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库技术.ppt

上传人:xinsheng2008 2017/10/19 文件大小:167 KB

下载得到文件列表

数据仓库技术.ppt

相关文档

文档介绍

文档介绍:数据仓库技术
—信管0701 HT
数据仓库技术
什么是数据仓库
数据仓库的产生
新一代数据仓库的发展趋势
总结
什么是数据仓库
概念
《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。
数据仓库作为DSS的有效解决方案,涉及3方面的技术内容:数据仓库技术、联机分析处理技术和数据挖掘技术。
特征
一、面向主题(Subject Oriented)的数据集合
二、集成(Integrated)的数据集合
三、时变(Time Variant)的数据集合
四、非易失(Nonvolatile)的数据集合

数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。
类型
一、企业数据仓库(EDW)
企业数据仓库为通用数据仓库,它既含有大量详细的数据,也含有大量累赘的或聚集的数据,这些数据具有不易改变性和面向历史性。
二、操作型数据库(ODS)
操作型数据库既可以被用来针对工作数据做决策支持,又可用做将数据加载到数据仓库时的过渡区域。
三、数据市集(DataMart)
数据市集是数据仓库的一种具体化,它可以包含轻度累计、历史的部门数据,适合特定企业中某个部门的需要。
数据仓库的产生
最初的数据管理形式主要是文件系统,少量的以数据片段之间增加一些关联和语义而构成层次或网状数据库,但数据的访问必须依赖于特定的程序,数据的存取方式是固定的、死板的。到了1969年,。此后,关系数据库的出现开创了数据管理的一个新时代。
近几十年来,大量新技术、新思路的涌现出来并被用于关系型数据库系统的开发和实现:客户/服务器系统结构、存储过程、多线索并发内核、异步I/O、代价优化,等等,这一切足以使得关系数据库系统的处理能力毫不逊色于传统封闭的数据库系统。而关系数据库在访问逻辑和应用上所带来的好处则远远不止这些,SQL的使用已成为一个不可阻挡的潮流,加上近些年来计算机硬件的处理能力呈数量级的递增,关系数据库最终成为联机事务处理系统的主宰。
整个80年代直到90年代初,联机事务处理一直是数据库应用的主流。当联机事务处理系统应用到一定阶段后,用户便发现单靠拥有联机事务处理已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的情况进行分析,而做出有利的决策,于是出现了基于业务数据的决策分析,我们把它称为联机分析处理。
事实上,将大量的业务数据应用于分析和统计原本是一个非常简单和自然的想法。但在实际的操作中,人们却发现要获得有用的信息并非如想象的那么容易。针对这一问题,人们设想专门为业务的统计分析建立一个数据中心。这个数据中心是一个联机的系统,它是专门为分析统计和决策支持应用服务的,通过它可以满足决策支持和联机分析应用所要求的一切。这个数据中心就叫做数据仓库。
新一代数据仓库的发展趋势
严格的投资回报率评估
整合数据集市
增加更多的分析
CRM与数据仓库之间的整合
动态数据仓库