1 / 6
文档名称:

数据仓库主题一.docx

格式:docx   大小:1,121KB   页数:6页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库主题一.docx

上传人:科技星球 2022/3/19 文件大小:1.09 MB

下载得到文件列表

数据仓库主题一.docx

相关文档

文档介绍

文档介绍:数据仓库主题一
 
 
一、典型的数据仓库建模思想一般主流分为两种
第一种
ER模型是数据仓库之父父 Bill lnmon 提出的建模方法是从全企业的高度设计
3NF 模型,用实体关系( Entity Relat 
 
数据仓库主题一
 
 
一、典型的数据仓库建模思想一般主流分为两种
第一种
ER模型是数据仓库之父父 Bill lnmon 提出的建模方法是从全企业的高度设计
3NF 模型,用实体关系( Entity Relationship, ER )模型描述企业业
务,在范式理论上符合 3NF 。后续又有人通过在其基础进行衍生和优化发展了 Data Vault 模型和Anchor 模型(具体类型思想可自行资料)
第二种
维度模型:维度模型是数据仓库领域的 Ralph Kimball 大师所倡导的,数据仓库工程领域最流行的数据仓库建模的经典。维度建模是从分析决策的需求出发构建模型。较好的大规模复杂查询的响应性能。其典型的代表是星形模型。具体业务设计可以分为以下几个步骤。
1、选择需要进行分析决策的业务过程。(业务工程中可以是单个业务事件,比如交易的支付、退款等;也可以是某个业务事件的状态,比如当前的账户余额;当然还可以是一系列的相关的业务事件组成业务流程,具体需要我们分析某些事件的发生情况,还是当前的状态,或者事件流转效率。)
2、选择合适粒度(我们要预判所有分析需要细分的程度,从而决定选择的粒度。粒度是维度的一个组合。)
3、识别维表(选择好粒度之后,就需要基于此粒度设计维表,包括维度的属性,用于后续我们进行分组和筛选)
4、选择实时表(确定分析需要的衡量指标)
kimball 这本书中建议建模方法 dwd 范式 dws 维度建模 (重要待确认)
二、数据仓库建模中规范定义
规范定义是指以维度建模为理论基础,对不同层级的做定义。规范数据体系架构命名:
具体的数据体系架构如下:
定义规范:(参考阿里)
数据域: 面向业务分析,将业务过程或者维度进行抽象集合,其中,业务过程可以概况为一个个不可已拆分的行为事件。在业务过程之下,可以定义指标;维度是指度量的环境。例如买家下单事件,如买家是维度。为保障整个体系的生命力数据域是需要抽象提炼并且长期维护和更新。并且不要轻易改动在划分数据域时 既能涵盖前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据域中和扩展
新的数据域。例子(如电商中的会员和店铺域、商品域、日志域、交易域、等)。
**业务过程:**指的是业务活动事件,如下单、支付、退款等都是业务过程。请注意,业务过程个不可拆分的行为亨,件
通俗地讲,业务过程就是企业活动中的事件。
时间周期:用来明确数据统计的时间范用或者时间点,如最近 30 天、自然周、截至当日等。
**修饰类型:**是对修饰词的一种抽象划分 修饰类型从属于某个业务域,如日志域的访问终端类型涵盖无线