1 / 119
文档名称:

数据仓库与数据挖掘原理及应用V2.pptx

格式:pptx   大小:904KB   页数:119页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘原理及应用V2.pptx

上传人:wz_198613 2019/2/17 文件大小:904 KB

下载得到文件列表

数据仓库与数据挖掘原理及应用V2.pptx

相关文档

文档介绍

文档介绍:、集成的、与时间相关的、不可修改的数据集合。此定义由最为权威的、被称为“数据仓库之父”。面向主题的是相对于传统数据库的面向应用而言的。所谓面向应用,指的是系统实现过程中主要围绕着一些应用或功能。而面向主题则考虑一个个的问题域,对问题域涉及到的数据和分析数据所采用的功能给予同样的重视。典型的主题领域顾客、产品、事务或活动、保险单、索赔和账目。(操作数据库)。由于历史的原因,各操作数据库的组织结构往往是不同的,在这些异构数据输入到数据仓库之前,必须经历一个集成过程。。应用问题的设计人员制定出不同的设计决策,且表示方法不同。例如编码、命名****惯、实际属性和属性度量等方面不一致。数据进入数据仓库时,需要消除各种不一致性。例如,数据仓库中顾客“性别”的编码,可采用“男/女”或“m/f”,采用哪种方式并不重要,重要的是在数据仓库中应该统一编码。如果应用数据编码为“X/Y”,则进入数据仓库时需要进行转换。此外,对所有应用所涉及的问题都要考虑一致性。例如命名****惯、键码结构、属性度量以及数据特点等。,时间维是数据仓库中很重要的一个维度。并且数据仓库中的数据时间跨度大,从几年甚至到几十年,称为历史数据。、更新操作,而对于数据仓库中数据的操作仅限于数据的初始导入和记录查询。操作型数据是一次访问和处理一个记录,可以对操作型数据库中的数据进行更新。但数据仓库中的数据则不同,通常是一起载入与访问的,在数据仓库环境中并不进行一般意义上的数据更新。