1 / 48
文档名称:

第二章数据仓库开发模型.ppt

格式:ppt   页数:48页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第二章数据仓库开发模型.ppt

上传人:分享精品 2016/2/19 文件大小:0 KB

下载得到文件列表

第二章数据仓库开发模型.ppt

文档介绍

文档介绍:DWDW的设计是一个复杂的过程:现实环境的设计是一个复杂的过程:现实环境→→抽象模型抽象模型→→具体实现。上述过程实现的期具体实现。上述过程实现的期间,使用了诸多的数据模型,间,使用了诸多的数据模型,…………§§1 1 引言引言§§2 2 概念模型概念模型§§3 3 逻辑模型逻辑模型§§4 4 物理模型物理模型§§5 5 元数据模型元数据模型§§6 6 粒度模型粒度模型§§7 7 聚集模型聚集模型第二章第二章数据仓库开发模型数据仓库开发模型§§1 1 引言引言创建创建DWDW时,需用各种时,需用各种数据模型数据模型对对DWDW进行进行描述。描述。DWDW的开发者依据这些数据模型,才能的开发者依据这些数据模型,才能开发出一个满足用户需求的开发出一个满足用户需求的DWDW。。为了使开发人员能够将注意力集中在数为了使开发人员能够将注意力集中在数据仓库开发的据仓库开发的主要部分主要部分,模型要有很好的适,模型要有很好的适应性,更易于修改,且,当用户的需求改变应性,更易于修改,且,当用户的需求改变时,仅对模型做出相应的变化就能反映这个时,仅对模型做出相应的变化就能反映这个改变。改变。CH2CH2模型模型是对现实世界进行抽象的工具。是对现实世界进行抽象的工具。信息管理中,需要将现实世界的事物及信息管理中,需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠息进行处理与管理,这就需要依靠数据模型数据模型作为这种转换的桥梁。作为这种转换的桥梁。上述的上述的转换转换一般需要经历从一般需要经历从现实现实到到概念概念模型模型,从,从概念模型概念模型到到逻辑模型逻辑模型,从,从逻辑模型逻辑模型到到物理模型物理模型的转换过程。的转换过程。CH2CH2现实世界现实世界概念世界概念世界逻辑世界逻辑世界计算机世界计算机世界信用信用张三张三客户客户客户与产品客户与产品特性特性属性属性列列(字段、数据项)(字段、数据项)个体个体实体实体记录记录整体整体同质总体同质总体表文件表文件整体间联系整体间联系异质总体异质总体数据库数据库现实世界与各个数据模型之间的关系现实世界与各个数据模型之间的关系CH2CH2此外,数据仓库的开发过程中,还要使此外,数据仓库的开发过程中,还要使用下述很重要的几个数据模型用下述很重要的几个数据模型————元数据模元数据模型型和和数据粒度数据粒度和和聚集模型聚集模型。。DWDW开发过程中,开发过程中,各个数据模型间的关系如下图所示。各个数据模型间的关系如下图所示。现实世界现实世界概念模型概念模型逻辑模型逻辑模型物理模型物理模型数据仓库数据仓库元数据模型元数据模型聚聚集集模模型型数据粒度和数据粒度和DWDW的的灵魂!灵魂!指导指导DWDW开发。开发。CH2CH2§§2 2 概念模型概念模型概念模型是对真实世界中问题域内的事概念模型是对真实世界中问题域内的事物的描述,包括:记号、内涵、外延,其中物的描述,包括:记号、内涵、外延,其中记号和内涵(视图)最具实际意义。记号和内涵(视图)最具实际意义。和和业务处理系统业务处理系统一样,数据仓库构建过一样,数据仓库构建过程中,也可以用程中,也可以用E-RE-R图图来表示概念模型来表示概念模型————这这样做的直接好处是,数据仓库与业务处理系样做的直接好处是,数据仓库与业务处理系统能够得到很好的协调。统能够得到很好的协调。CH2CH2①①改进的改进的E-RE-R图图与业务处理系统中的数据库概念设计一与业务处理系统中的数据库概念设计一样,数据仓库也可以用三个层次的数据模型样,数据仓库也可以用三个层次的数据模型来描述来描述————高层模型高层模型((E-RE-R图)、图)、中层模型中层模型(逻辑层)和(逻辑层)和底层模型底层模型(物理层)。但要注(物理层)。但要注意两者之间的差异:意两者之间的差异:??数据类型的差异数据类型的差异DWDW中不包含中不包含操作型数据操作型数据,只包含用户感,只包含用户感兴趣的兴趣的分析数据分析数据(如,商品的销量、企业的(如,商品的销量、企业的利润等)、利润等)、描述数据描述数据(如,销售时间、地点)(如,销售时间、地点)CH2CH2以及以及细节数据细节数据(如,所销售商品的详情、客(如,所销售商品的详情、客户详情等)。户详情等)。??数据的历史变迁性数据的历史变迁性业务处理系统业务处理系统中,一般只包含当前数据中,一般只包含当前数据而不含历史数据;而不含历史数据;数据仓库数据仓库中,为了反映出组织的历史变中,为了反映出组织的历史变迁、业务的发展等,需要增加时间属性进行迁、业务的发展等,需要增加时间属性进行描述(即把时间作为关键字的一部分)。描述(即把时间作为关键字的一部分)。??数据的概括性数据的概括性