1 / 22
文档名称:

数据仓库事实、度量及事实表设计.docx

格式:docx   大小:338KB   页数:22页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库事实、度量及事实表设计.docx

上传人:aihuichuanran1314 2018/7/25 文件大小:338 KB

下载得到文件列表

数据仓库事实、度量及事实表设计.docx

相关文档

文档介绍

文档介绍:数据仓库事实、度量及事实表设计
确定分析内容的构成:事实及其粒度
事实表是数据库中最大的表,是星形模型结构的核心。事实表包含了基本商业事务的详细信息,是对商务活动进行客户关系、销售趋势和产品趋势等分析的素材。事实表的设计包括对事实的选择、量度的构造、粒度的设计和聚合的设计等。
  事实、度量和事实表
事实是各个维度的交点,是对某个特定事件的度量。维度中的属性描述的是维本身的属性,比如客户的性别、年龄、姓名和地址,这些都是客户的固有属性。
度量是客户发生事件或动作的事实记录,比如客户打电话,可能选择的度量有通话时长、通话次数和通话费用等;客户购买商品,可能选择的度量有购买的次数、购买商品的金额和购买商品的数量等。度量变量的取值可以是离散的数值,也可以是连续的数值。比如,客户通话次数是离散的数值,而客户购买商品的金额是连续的数值。度量变量也可以在某个元素集合内取值。比如客户对公司服务质量的评定可以是很好(Excellent)、好(Good)、一般(Fair)和差(Poor)中的一个。
事实表则是位于星形架构或雪花形架构中间,用来记录商务事实和相应统计指标的表。同维表相比,事实表具有如下的特征。
记录数量很多。
事实表中除了度量变量外,其他字段都是同维表或者中间表(对于雪花形模型)的关键字。
如果事实相关的维度很多,则事实表的字段数也会比较多。
从事实表记录数多的特征中,我们可以得到事实表设计的一个感性认识,即事实表应当尽量减小一条记录的长度,只有这样才能避免事实表过大而难于管理。相对维表来说,事实表是“细长”的结构,如图3-35所示。
  
图3-35  事实表的特征
  事实表的设计
由以上分析可知,事实表中一般要包含2部分:一是由主键和外键所组成的键部分,另一部分是用户希望在数据仓库中所了解的数值指标,这些指标是为每个派生出来的键而定义和计算的,称为事实或指标。由于事实是一种度量,所以事实表中的这种指标往往需要具有数值化和可加性的特征。但是在事实表中,只有那些具有完全可加性的事实才能根据所有的维度进行累加而具有意义。而事实表有一些事实表示的是某种强度,这类事实就不具有完全加法性,而是一种半加法性。例如,账目余款反映的是某个时间点的数据,它可以按照地点和商品等大多数维度进行累加,但是对于时间维度则例外,将一年中每个月的账目余款进行累加是毫无意义的,而决策者则可能需要了解所有地区和所有商品账目余款的累加值。在事实表中还有一些事实是非加法性的,即这些事实具有对事实的描述特性,在这种情况下一般要将这些非加法性事实转移到维度表中。
以事实表中度量的可加性情况,可以把事实表及其包含的事实分为4种样式。

事务事实以企业事件的单一情况为基础,因此通常只包含事实的次数这一种度量条件,应该尽可能以最低级别来表示。比如银行的ATM提款机的提款次数,使用某种服务的次数等。

快照事实以企业在某一特定时间的特殊状态为基础。也就是只有在某一段时间内才出现的结果。它们也许没有包含所有维的条件,比如不是所有的产品每天都有销售量。

这类事实通常用来储存关于企业经营项目的详细信息。包括表现与企业相关的个别线性项目的所有度量条件,比如销售数量、销售金额、成本和运费等数值数据,也就是关键性能指标。此类事实运用范围很广,比如采购、销售和库存等。
(状态事实)
这是类特殊的事实,通常只表示事件发生与否和一些非事实本身具备的细节。它所表现的是一个事件发生后的结果变化,并且没有度量数值表示。如哪些产品在促销期间内没有卖出,有还是没有,就是事件或状态事实所表现的结果。
在事实表模型的设计中还需要注意到派生事实。派生事实主要有2种,一种是可以用同一事实表中的其他事实计算得到,例如销售行为中的商品单价可以用商品的销售总金额和销售数量计算得到,对于这些派生事实一般不保留在事实表中;另一种是非加法性事实,例如各种商品的利润率等各种比率。
在事实表模型的设计中必须要考虑到事实表中的这些事实特性,通过多次反复来确定。首先,通过调查确定所有可能的基本事实和派生事实;然后,对所有的事实按照功能或某种方式进行排序,以删除重复的事实;接着,确认那些基于不同准则但是有相同性质的派生事实,例如公司门市销售总额与地区销售总额虽由于维度的不同而被定义为不同的事实,但实际计算方法是一样的;最后,再一次确定事实表模型,在确认中要检查所有的计算派生事实的基本事实是否已经包含在模型中,并且与用户取得—致。
在设计事实表时,一定要注意使事实表尽可能地小,因为过于庞大的事实表在表的处理、备份和恢复及用户的查询等方面需要较长的时间。在实际设计时,可以利用减少列的数量、降低每一列的大小和把历史数据

最近更新

二零二五年度新型绿色建材销售合同模板 14页

二零二五年度新能源汽车整车运输服务协议 14页

二零二五年度旅游服务担保合同诉讼起诉状范例.. 14页

二零二五年度智慧家居场协作伙伴关系合同 15页

二零二五年度智能化班车服务合同 14页

二零二五年度最长担保期限与互联网金融服务合.. 16页

二零二五年度柴油销售商与国内外货运代理服务.. 14页

二零二五年度步行街个人店铺租赁与绿色环保责.. 13页

二零二五年度汽车保险居间服务合同A 16页

二零二五年度汽车配件抵押借款合同 15页

二零二五年度海绵城市建设安装施工承包合同 15页

二零二五年度爆破拆除工程爆破拆除施工监理合.. 17页

二零二五年度特色装修办公室带物业托管租赁协.. 14页

二零二五年度玻璃屋顶施工与节能合同 15页

二零二五年度瓷砖铺贴施工与装配式建筑部件生.. 17页

二零二五年度电动汽车充电桩工程监理合同 19页

二零二五年度电商行业商铺安全协议范本 14页

百家讲坛讲稿苏轼 102页

2024年江西公务员考试申论试题及参考答案(市.. 18页

大学mooc英语听力技能与实践(集美大学)章节测.. 3页

直流电机双闭环调速大作业 26页

乳制品生产作业指导书 11页

涵洞承包合同样本样本 15页

独家房业务培训 25页

1991年水利工程确权发证文件(河北省国家土地局.. 9页

颗粒分析自动运算 1页

液氧贮罐和二氧化碳储罐日常检查记录 2页