1 / 15
文档名称:

数据仓库ppt课件.ppt

格式:ppt   大小:489KB   页数:15页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库ppt课件.ppt

上传人:相惜 2019/6/13 文件大小:489 KB

下载得到文件列表

数据仓库ppt课件.ppt

文档介绍

文档介绍:数据仓库DataWarehouse*数据仓库——起源由20世纪60年代初期,运行在主文件上的单个应用是存储在磁带上,发展到1970年出现新的存储技术,磁盘存储器(essStorageDevice,DASD)数据库管理系统(DatabaseManagementSystem,DBMS),70年代中期,出现了联机事务处理(ransactionProcessing,OLTP)。联机事务处理提高了访问数据的快速,可以完成许多过去无法完成的事情。随着PC机的发展,人们开始利用数据做更多的事。出现了抽取程序。抽取技术,可以实现把想要的数据从联机事务处理系统中分离出来,解决数据分析性能方面的问题。慢慢的人们发现在抽取结果中,加上一些条件限制可以更方便的得到想要的数据,于是就出现了基于抽取之上的抽取。当人们意识到无休止的抽取带来诸多问题后,开始思考是否可以建立成体系的机构化环境,以减少数据的差异。这也就是数据仓库出现的原因。*数据仓库——术语BI:(BusinessIntelligence):即商业智能,也看到有些媒体里写作商务智能综合企业所有沉淀下来的信息,用科学的分析方法,为企业领导提供科学决策信息的过程。DM(DataMine):数据挖掘是一个从大型数据库中提取以前未知的,可理解的,可执行的有价值的信息并用它来进行关键的商业决策的过程。联机事务处理(OLTP):面向交易的处理过程,其基本特征是前台接收的用户数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果,是对用户操作快速响应的方式之一。联机分析处理(OLAP):使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。*数据仓库——发展数据仓库,由数据仓库之父比尔·恩门(BillInmon)于1990年提出,主要功能是将组织透过资讯系统和联机事务处理(OLTP)经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一有系统的分析整理,以利各种分析方法如联机分析处理(OLAP)、数据挖掘(DataMining)之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS)之创建,帮助决策者能快速有效的从大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助建构商业智能(BI)。数据仓库之父比尔·恩门(BillInmon)在1991年出版的“BuildingtheDataWarehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受——数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策(DecisionMakingSupport)。*数据仓库——;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。;数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库。;数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询。、非规范化;时间序列数据集合通常非常大,数据仓库可以是而且经常是冗余的。*为什么需要数据仓库?数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。数据仓库的方案建设的目的,为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。所以需要数据仓库为公司的决策提供数据支持和分析。;数据仓库的分析数据一般分为日、周、月、季、年等,可以看出要求24小时甚至12小时内,客户能看到昨天的数据分析。、扩展性;准确的数据以及数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。;数据仓库中的数据是按照一定的主题域进行组织的,排除对于决策无用的数据,提供特定主题的简明视图。*数据仓库与数据库的区别出发点不同:数据库是面向事务的设计;数据仓库是面向主题设计的。存储的数据不同:数据库一般存储在线交易数据;数据仓库存储的一般是历史数据。容量不同、设计规则不同:数据库设计是尽量避免冗余,一般采用符合范式的规则来设计;数据仓库在设计是有意引入冗余,采用反范式的方式来设计。提供的功能不同:数据库是为捕获数据而设计,数据仓库是为分析数据而设计。基本元素不同:数据库的基本元素是事实表,数据仓库的基本元素是维度表。服务对象不同: