文档介绍:该【数据仓库建设方案 】是由【天天湖人】上传分享,文档一共【7】页,该文档可以免费在线阅读,需要了解更多关于【数据仓库建设方案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据库房建设
商务智能(BusinessIntelligence)用于支持拟订业务决议的技术、
流程、技术、应用和实践。核心是经过数据提取、整理、剖析,最后经过
剖析结果拟订有关策略、规划,帮助公司认识新的趋向、抓住新的市场机
会、发现潜伏的威迫,达到资源的合理配置,节俭成本提升效益。数据仓
库是商业智能的基础,它为OLAP、数据发掘供给剖析和决议支持。
一、数据库房观点
数据库房定义
是一个面向主题的、集成的、相对稳固的、反应有有历史变化的数据会合,用于支持管理决议。拥有以下特色:
详尽交易及有关业务数据的会合
包括必需的内部与外面信息
来自于多个数据源、业务操作系统
保留必定的时间周期
依据公司内业务规则决定储存模型
建设的必需性
当前大部分信息系统因为建设时间、建设方、各阶段需求不一样,会出
现一系列问题:缺少整体规则、信息缺少完好性、缺少一致的信息管理标
准和规范、信息孤岛、不具备大容量的数据管理和剖析能力。
价值
提升管理决议的科学性和管理效率
信息的整合,可推进此刻有信息管理系统的重构
打通讯息孤岛全局共享,降低数据获得的难度
渐渐代替各种业务管理报表系统
运用历史数据发现规律
二、数据库房建设
业务需求定义
梳理出全部业务过程,剖析业务内容提取需求,对其有关的数据进行探查,
并对各系统核心业务人员访谈,正确的认识业务需讨状况,近期调研
技术系统构造
生命周期图
技术架构图:
数据库房数据建模
数据模型是抽象描绘现实世界的一种方法,是经过抽象的实体及实体之间的
联系来表示现实世界中事务的互相关系的一种映照,数据库房模型是数据模型中
针对特定的数据库房应用系统的特定模型。数据库房建模方法种类许多,常有的
三种是范式建模、维度建模、实体建模,每种方法实质上都是从不一样的角度解决
业务中的问题。
对于数据库房建模独自用一篇来详尽介绍,这儿仅对维度建模做基本的介绍,维度建模由数据库房领域另一位大师RalphKimall所倡议,是数据库房工程领域最流行的数仓建模经典。维度建模以剖析决议的需求出发建立模型,
建立的数据模型为剖析需求服务,所以它要点解决用户怎样更迅速达成剖析需求,同时还有较好的大规模复杂查问的响应性能。
维度模型是什么
维度建模将客观世界区分为胸怀和上下文。胸怀是由业务过程和支持它们的业务源系统来捕获的,经常以数据值形式出现,将其称作“事实”,事实由大批上下文包围着,这些文本形式的上下文被直观地切割成多个独立的逻辑
块,我们称其为“维”。维度描绘了胸怀上下文的5W(who、what、when、where、why)信息,以及这些上下文是怎样作用的。
公司的每一个业务过程都能够用维度模型来描绘,维度模型由一系列含有
数值量胸怀的事实表构成,事实表中的数值则被一系列带有文本属性的维度
表围绕。
维度建模的基本因素
事实表
事实表是储存业务活动或事件所产生的胸怀。
维度表
维度是察看业务的角度,维度表记录这一角度的一系列属性会合。
胸怀
胸怀是对于业务状况的数值。
公司数据库房总线
维度建模四步骤
选择业务过程(比方:用户注册、账户签约、产品交易等)
申明粒度(确立数据单位的综合程度,明确事实表胸怀所表示的含义)
辨别维度(粒度已经确立了一个基本的维度会合,依据需要再增添其余有关的维度)
辨别事实(选择合适业务过程的指标)
深入理解维度
代理要点字、退货维、迟缓变化维、角色饰演维、杂项维、雪花型、桥接多值维、办理层次构造。
可加型事实、半加型事实、状态事实
三种事实表(三个基本粒度):事实事实表(低粒度)、周期快照事实表(粒度高)、周期累计事实表
三、数仓管理
数据质量
数据变换加载(ETL过程)
,部署在MyEclipse中做一些外头的开发,
核心数据办理工作由Kettle达成,对于特别的需求,能够自定义开发。
元数据管理
拜见《元数据管理解决方案》
安全及备份
利用数据库房自带的备份功能。
四、系统开发
物理数据库建设、ETL工具开发、数据抽取冲洗作业开发、查问优化、出
报表等。
五、应用开发
需求调研后增补。
六、迭代优化
螺旋式上涨,永无止境