1 / 33
文档名称:

数据仓库开发实例.ppt

格式:ppt   大小:312KB   页数:33页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库开发实例.ppt

上传人:相惜 2022/2/25 文件大小:312 KB

下载得到文件列表

数据仓库开发实例.ppt

相关文档

文档介绍

文档介绍:数据仓库开发实例
编辑ppt
主要内容:
数据仓库的需求分析
数据仓库概念模型构造
数据仓库逻辑模型设计
数据仓库元数据设计
编辑ppt
实例背景
某大型连锁超市的业务涵盖于3个省范围内的1000多家分店。每个分店都有较事实表中可大大减少数据仓库工作时的工作量,还可以保证所有用户在使用商品销售利润这一重要数据时的一致性。
商品销售单价对于计算商品利润十分重要,但将某个商品一段时间内的所有销售单价相加是毫无意义的。管理人员可能只对某一时间段内某个商品的平均销售价感兴趣。平均销售价格可以用该时间段内的商品销售额除以商品销售量获取。在事实表中可以不用商品销售单价,代之以商品销售额,销售额也常常是管理人员衡量营销策略好坏的重要指标。
编辑ppt
超市营销数据仓库事实表模型
超市管理者还可能对商品销售的利润率感兴趣,该数据可以用商品销售利润除以销售额获得,该数据不是一个可加数据。将比率或百分数的数据进行相加,所获得的数据是没有什么意义的。管理人员在了解某一时期某些商品的利润率时,完全可以利用该时期该商品利润和销售额获得。
因此,事实表中确定度量数据为商品销售量、商品销售额、商品成本和商品销售利润。
编辑ppt
超市数据仓库维表模型设计

日期维模型是许多数据仓库应用中的常用维度,其设计方式与其他多数维模型有差别。具体设计时,日期维可以存放以日期表示的5到10年的数据行,也可以将3至4年的数据行作为日期维内容。如果对10年的每一天都进行存储,也只需要3650行
日期维的每列由行所代表的特定日期进行定义。“星期”列含有像“星期一”这样的名称内容,该列可用于创建比较“星期一”与“星期日”销售情况对比的查询。日历日期编号从1开始取值,然后根据月份的情况取到28、29、30或者31,这一列主要用于对每个月的同一天进行比较。同样,可以给出日历周编号、和日历月编号(1,…,12)。
编辑ppt
纪元表示法采用从某纪元开始连续对日期进行计数的方法来给出日期编号,在表中还可以给出“星期”与“月份”的绝对编号列。这些数据支持跨年度跨月份的简单数据运算。在生成报表时,经常要给出像“一月”这样的月份名称。因此,为报表确定一个“年月”(YYYY-MM)列标题也有必要。报表中很可能需要季度编号(Q1,…,Q4) 或年季度编号列。如果企业的财政年度与日历表在周期上不一致,还需要为财政年度给出类似列。
在“节假日”列中给出“节假日”或者“非节假日”的内容,维表属性作为数据分析的导航,简单地在“节假日”列中给出“Y”或者“N”对数据分析没有多大用处。例如,在生成某种商品的节假日与非节假日销售情况比较查询时,列中给出“节假日”或者“非节假日”这样有意义的值要比一个简单的“Y”或者“N”之类的值有用得多。
编辑ppt
“星期六”与“星期日”要归入“周末”之列。当然,可以对多个日期表属性进行共同约束,从而能够实现一些像平日假期销售与周末假期销售进行比较的数据仓库应用。
“销售时节”列应设置为销售时节的名称,例如,春节、情人节、端午节、五一节、国庆节、中秋节、重阳节、圣诞节、或者标为“不是”。
“重大事件”列与“销售时节”列情形类似,可以标记为“周日大采购”或者“中秋合家欢”这样与日期有特殊联系的促销事件。而一般性的促销活动通常不放在日期表中处理,以促销维表的形式进行更加完整的描述。因为促销事件并不是仅仅由日期来定义,通常还需要由日期、商品与商店的组合来定义。
编辑ppt
编辑ppt
编辑ppt
一般超市分店可能存储60000个商品编号,但大型连锁超市保留不再销售的历史商品营销方案情况,商品维度可能至少需要150000行乃至多达百万行。
商品维度数据主要来源于业务系统的商品主文件。超市总部对所销售商品的主文件进行统一管理。
商品主文件的一个重要作用,就是维护每个商品存储标志的许多描述属性。商品维是一组重要的属性。
某个商品种类包含多个商品子类,商品子类包含多个商标,商标包含多个商品存储标志。
还应包含描述商品形状或存储位置的层次属性,例如商品的包装类型、包装尺寸、包装数量、托盘中的包装数,以及与商品存储的层次:存储类型、货架结构等维度。

编辑ppt

分店维表用于描述超市的各个链锁店。分店维表是基本的地理维度,