文档介绍:数据库与数据仓库的比较
传统的数据库技术是以单一的数据资源, 即数据库为中心, 进行从事务处理、 批
处理到决策分析等各种类型的数据处理工作。 然而, 不同类型的数据有着不同的
处理特点, 以单一的数据组织方式进行组织的数据库并不能反映这种差异, 特别
是满足不了现代商业企业数据处理多样化的要求。随着数据库应用的广泛普及,
人们对数据处理的这种多层次特点有了更清晰的认识。 总结起来, 当前的商业企
业数据处理可以大致地划分为两大类: 操作型处理和分析型处理。 操作型处理也
叫事务处理, 是指对数据库联机的日常操作, 通常是对一个或一组记录的查询和
修改, 主要是为企业的特定应用服务的, 人们关心的是响应时间、 数据的安全性
和完整性。 分析型处理则用于商业企业管理人员的决策分析。 两者之间的巨大差
异使得操作型处理和分析型处理的分离成为必然。 这种分离, 划清了数据处理的
分析型环境与操作型环境之间的界限, 从而由原来的以单一数据库为中心的数据
环境发展成为一种新环境:体系化环境。
数据库系统作为数据管理手段, 主要用于事务处理。 在这些数据库中已经保存了
大量的日常业务数据。传统的 DSS (决策支持系统)一般是直接建立在这种事
务处理环境上的。 数据库技术一直力图使自己能胜任从事务处理、 批处理到分析
处理的各种类型的信息处理任务。 尽管数据库在事务处理方面的应用获得了巨大
的成功, 但它对分析处理的支持一直不能令人满意, 尤其是当以业务处理为主的
联机事务处理(OLTP)应用与以分析处理为主的DSS应用共存于同一个数据库
系统时, 两种类型的处理发生了明显的冲突。 人们逐渐认识到, 事务处理和分析
处理具有极不相同的性质,直接使用事务处理环境来支持 DSS 是行不通的。
具体来说,事务处理环境不适合 DSS 应用的原因概括起来主要有以下 5 条:
、事务处理和分析处理的性能特性不同
在事务处理环境中, 用户的行为特点是数据的存取操作频率高而每次操作处理的
时间短, 因此, 系统可以允许多个用户按分时方式使用系统资源, 同时保持较短
的响应时间, OLTP 是这种环境下的典型应用。
在分析处理环境中,用户的行为模式与此完全不同,某个 DSS 应用程序可能需
要连续运行几个小时, 从而消耗大量的系统资源。 将具有如此不同处理性能的两
种应用放在同一个环境中运行显然是不适当的。
、数据集成问题
DSS 需要集成的数据。全面而正确的数据是有效的分析和决策的首要前提,相
关数据收集得越完整,得到的结果就越可靠。因此, DSS 不仅需要整个企业内
部各部门的相关数据,还需要企业外部、竞争对手等处的相关数据。
事务处理的目的在于使业务处理自动化, 一般只需要与本部门业务有关的当前数
据。 而对整个企业范围内的集成应用考虑得很少。 当前绝大部分企业内数据的真
正状况是分散而非集成的。 造成这种分散的原因有很多种, 主要有事务处理应用
分散、 “蜘蛛网”问题、数据不一致问题、外部数据和非结构化数据。
( 1)事务处理应用的分散
当前商业企业内部各事务处理应用间实际上几乎都是独立的, 之所以出现这种现
象有多种原因。 有的原因是设计方面的, 例如: 系统设计人员为了减少系统开发
费