文档介绍:数据集市建设方案
目录
CONTENTS
四数集定位2
数据集市的构建思路
数据集市的实战分析
01>〉数据集市的定位
数据应用类系统常见的概念
应用系统
建一系列的功能块,我们般将该类应用系统称为数据类
应用数据库
預测概率信忘等数据集市的产出外,为了各个应用系统的实
存储了关于指标的评价,信号的处理流程信忠,预测率
数据集市DM
母和基本数据维度往往小于数据仓库,但是
因此数据集市中往往具备懿据仓库中缺少
数据仓库DW
ψ獸罪
数据集市的全景视图
推荐系统
RM系统营销活动审批系统
绩效考核系统}运言优化系统
CRM系統应用数据库营销活动审批系統数据库
营优化
君库
营销数据集市
6载提客向购买品数户动产次数幸向店辅精次数
绩效数据集市运营数据集市
主数据客户主数产品主数摇店铺主款据行为主数交易主数
数据仓库
客户主数据
产品主教据
员工主数据
店铺主数据
庄数据交易主数据
首理主数据
数据集市的价值体现
回晶
向下(数据仓库)
提供业务沉淀
[能]
个个个
(其他数据集
市与营
节之间往往需要相互依,当然
是否提供横向交互或者统一通过数据仓库交互
需要根据各个企业的T整体划来确定
√个个
全[
定的数据须留
据都申新整合
应用系统
数据集市的主要组成
预测数据
行生数据是数据集市的价值提升点
分类数据
通过对基础数据的分析、挖掘,根
衍生数据
关联数据
据,基于专家规则和机器学****的预
测和分类数据
指标数据
主题数据
数据集市
基础据是数据集市的数据基
主要通过从数据仓库豆者源系统
基础数据
整合数据
L获得,基础数据根据每个数
集市的业务需求,各有不同,数据
集市应当具备数锯清洗,加工,整
合等功能。
原始数据
以营销数据集市为例进行介绍
输出层(按应用
产品推
ⅥP专属
,4+面图楼2
客户标签产品标签
客户类排标成本类指标
客户价值客户信息
交付属数按需求进行分类,个舯立的需求个人截集市
供独立的魏,每个需求的魏均使用独立的用户进行存储
销类子表
应的务系统,
衍生层(按体系)
产品主题
渠道主题
成体系
产品盈利
原吧的希求配沉淀,衍生层则是面应场的,
是为吗隔需求而經的
整合层(按主题
产品主题
渠道主题
在数据环原较成熟的企业,比如已经具有一定規杈的敖据仓库
客户
产品信忘产品反馈
渠道信忠渠道类型
深需选择,适加工原,同需要专岛一
网蟹进行要
客户反馈
产品周期
渠道交易
数婚包含的为细跷,为后续的数衍生
贴源层(按系统)
贴调层的敖据主要来源子各个原始系统
A系统产品信息
但在快少数据仓库的环垸下,数揖集市需要承担该部分款的整
保排致,井不执行任间清洗动
户基本嗉统产品鸡买:系统产品信息系统喜
唑,便于后续问和
02》>数据集市的构建思路
数据集市构建需遵循的一般策略
数据采集鲧
数据加载策略
数据保存策略
全呈卸裁
全量加载
13月原则
对于源业务系统数据,如:客户类,账
取得所需要的数据
一个基本于数選剧,从元握
务类以及渐变维度
初贻七目标表,删除目标表中吖数据
完整年度丢兄,这是菜击建没服
存在每天更新变化可
把临时表中的数据入到目标表
阶段基本妄求
性
用全载
七对加载
难苷放內密和兰理类应用的扩展,保
度明败和材效是,当午午度
时客的世易录每条记录当目标表中需要保留纪的历
效,即基本留存25~月在,或坦司
杆汇总的基本要求
帑是一个新的事件,相互之间股有必然
一般采用比对加载,通过状态
期
和结束日期来对戮据进行处理,如总帐余
宁我将新妙取出来加球到库。额等
增呈加载
当目标表中需要保留很详田的每次变细/有是务和年斯的
第次抽取全量初始1
节或者记录不会变动的数炬时,如豈记、
长放,特别是值用
后卖每日日终抽取当日新发生的0易流水等纪买的历史伏时,般果候拿生分座不数
用增量加载方式