1 / 31
文档名称:

数据仓库基础知识.ppt

格式:ppt   大小:162KB   页数:31页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库基础知识.ppt

上传人:sxlw2014 2022/2/9 文件大小:162 KB

下载得到文件列表

数据仓库基础知识.ppt

文档介绍

文档介绍:数据仓库基础知识
安徽国税信息中心 赵为民
1
数据仓库基本概念
数据仓库技术产生的背景
什么是数据仓库技术
数据仓库技术组成
数据参考参考架构
数据仓库的建设步骤
2
信息技术发展的几个阶段
1960s:数据采集、数库应用——执法监督
14
税务数据仓库应用——业务分析
15
税务数据仓库应用——预测
16
为什么要建立数据仓库
目前数据应用存在的问题:
数据存放较分散,异构环境不易进行统一的查询访问。
源于事务处理的数据存储模式不能满足现有的需求。表现在:
A、决策层需要的信息往往涉及到大量的计算、比较、分析。同时需要对结果从各个维度观察,功能上要可以旋转、切片、钻取。而在操作型的海量数据库中,一个简单的统计就需要等待很长的时间。效率十分低下。多维分析无法在面向事务的数据库中进行 。这极大地限制了数据利用工作的深入开展。
17
为什么要建立数据仓库
源于事务处理的数据存储模式不能满足现有的需求。表现在:
B、场景无法再现。这也是事务处理不储存历史数据,不存储变更信息的原因。同样的一条sql语句。在不同的时间点上运行。结果不同。
C、现有的查询展现方式单一,分析人员很难随时按自己的分析需要得到结果。编程人员需要在数据展现上做大量的工作。
D、报表制作费时费力。
E、信息中心信任危机:
18
为什么要建立数据仓库
数据与信息的鸿沟扩大
业务人员在需要的时候得不到信息,或者得到的信息不准确,领导获取信息的能力也没有提高,仍然是通过传统的方式要数据、要报表、要结果,数据与信息的鸿沟不断扩大。
19
数据仓库的作用和意义
作用:
对已采集的数据进行简单加工,为领导层提供真实可靠的信息,以全面了解税务管理状况;
为工作制度的建设提供真实的现状和优化的策略;
通过数据信息的应用,拓宽管理者的视野,挖掘领导者的思维深度,改原经验决策为科学决策;
辅助领导者的思想和决策更具前瞻,通过科学预测对未来进行准确的定位。
税务:打击偷税漏税?调整税务策略?制定征收计划?
个税起征点提高
选案分析
核定应纳税额
20
数据仓库的作用和意义
作用:
帮助企业对已有数据进行归纳分析,总结过去的规律,并在此规律的基础上进行挖掘利用,预测未来的发展,指导企业经营和发展。
将企业数据快速转换为经济价值。
零售业:啤酒+尿布
银行:哪些客户是我的重点客户?如何防止客户流失?
电信:营销效果分析?如何防止欺诈?
21
数据仓库基本概念
数据仓库技术产生的背景
什么是数据仓库技术
数据仓库技术组成
数据仓库参考架构
数据仓库的建设步骤
22
数据仓库的组成
数据存储
数据仓库的存储是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。相对于操作型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。
ETL数据抽取
把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,应能生成COBOL程序、MVS作业控制语言(JCL)和SQL语句等,以访问不同的数据。数据转换都包括,删除对决策应用没有意义的数据段;转换到统一的数据名称和定义;计算统计和衍生数据;给缺值数据赋给缺省值;把不同的数据定义方式统一。
23
数据仓库的组成
联机分析处理(On-LineAnalyticalProcessing,简称OLAP)
Codd提出OLAP的12条准则来描述OLAP系统:       准则1 OLAP模型必须提供多维概念视图
       准则2 透明性准则       准则3 存取能力推测       准则4 稳定的报表能力       准则5 客户/服务器体系结构     
准则6 维的等同性准则       准则7 动态的稀疏矩阵处理准则       准则8 多用户支持能力准则       准则9 非受限的跨维操作       准则10 直观的数据操纵       准则11 灵活的报表生成       准则12 不受限的维与聚集层次
24
数据仓库的组成
结果展现
通过多样化的前端分析展示工具,实现对数据仓库中数据的分析 和处理,形成市场经营和决策工作所需要的科学、准确、及时的业务信息和知识 。
数据集市
为了特定的应用目的或应用范围,从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。
25
数据仓库的组成