1 / 183
文档名称:

第11章数据仓库11.1关于数据仓库.ppt

格式:ppt   大小:641KB   页数:183页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第11章数据仓库11.1关于数据仓库.ppt

上传人:weizifan339913 2018/1/6 文件大小:641 KB

下载得到文件列表

第11章数据仓库11.1关于数据仓库.ppt

相关文档

文档介绍

文档介绍:第11章数据仓库 关于数据仓库
从事务数据到决策知识
DBMS的发展轨迹清晰的表明,它是在服务于联机事务处理(Online Transaction Processing,OLTP)中不断完善和丰富起来的,,将数据集分成了甚少冗余的实体(Entity),并利用关系(Relationship)将这些实体组织成一个有机的整体,较好地满足了OLTP的应用需求。其主要目的在于操作数据,而不在于分析数据,因此它提供了强大的数据存取、增添、删除、修改等操作的功能体系。
另一方面,由于这些数据资料十分繁杂、零乱甚至互相矛盾,而且缺乏集中存储管理和一致的应用接口,从而导致已有的数据其实也不能为预测和决策服务提供多少有用的信息。这相对于数据库系统的投入而言是一种极大的资源浪费。
1 基于事务数据库的DSS的缺陷:
(1) 数据缺乏组织性。DSS需要集成的数据,全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠,DSS必须依赖数据库抽取技术进行数据的重组。抽取程序的任务是搜索整个数据库,利用某些算法和规则选择符合要求的数据,并把数据传到其他数据库中。但实际应用中,由于各种业务数据分散在异构的分布式环境中,数据源中数据会随着时间的推移而发生变化,而各个部门抽取的数据没有统一的时间基准,抽取源、抽取算法、抽取级别也各不相同,因此数据缺乏可信性,DSS的可信度和效果也随之大大降低。
(2) 业务数据本身大多以原始的形式存储,难以转换为有用的信息。事务处理的目的在于使业务处理自动化和简单化,因此数据的表达上尽可能简化以利于存储,即使是描述同一属性,在不同的库中也可能有不同的表达方式。考虑对某人“性别”的编码,在数据库A中编码为‘m’,而在数据库B编码为‘男’,则DSS分析时该如何采信这些数据。因此事务处理应用中数据的分散性、数据的不一致性,增加了DSS的推理分析问题的难度、速度以及正确性。
(3) 服务于联机事务处理(OLTP)的关系数据库是面向操作的而不是面向分析的,它首先要求数据库系统具有实时响应能力,另外数据库系统也是一个时变的系统。而一个DSS分析与推理可能需要数秒或者数小时,甚至更长的时间,如果其基于的数据在不停的变化,会导致决策分析的求解过程永远无法完成。因此本质上传统数据库是很难为数据分析提供有意义的数据的,这二者本身就是一对矛盾体。
2 DSS所期望的理想数据源:
为了满足DSS分析,需要为它提供一个独立、数据格式统一、集成了某一主题所需的全部数据、在DSS分析期间相对稳定、但又可与具体应用同步更新以保持“最新”数据的数据库。
数据格式统一:是指该数据库中同一问题的属性字段都采用同一种表达方式来描述。具有一致的命名规则,一致的变量单位,一致的编码结构和一致的特性描述等。
集成了某一主题所需的全部数据:是指用户使用数据库辅助决策时所关心的重点问题,每一个主题对应一个客观分析领域。
独立:是指该数据库与事务数据库隔离开来,割断这两者间的相互牵制。事务数据库必然要求能响应且实时响应对它的读写事务操作,而DSS分析过程是对现有数据的一个推理演算,它不需要修改数据库中的数据,否则会影响其它DSS的分析过程,因此它对于DSS而言是一个只读型的数据库。