1 / 7
文档名称:

数据仓库导论.doc

格式:doc   大小:51KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库导论.doc

上传人:cai.li.bin 2017/11/7 文件大小:51 KB

下载得到文件列表

数据仓库导论.doc

相关文档

文档介绍

文档介绍:数据仓库导论
§ 数据仓库的发展
大家知道,管理信息系统早已成功地应用于全球的各行各业,并积累了大量的数据,基本上满足了用户对数据存储、查询和统计的需要,应该说,管理信息系统的成功得益于数据库技术的进一步完善。
随着社会的发展和技术的进步,信息已成为人类社会中除了物质、能源之外的第三大资源,社会的信息化,使信息量急剧增长,大量的信息来不及组织和处理。面对急剧增长的信息,对数据库系统的应用只停留在查询、统计等几个方面,远远没有发挥数据库中数据的作用和价值。
正如奈斯比特在《大趋势》中所说的:“我们正在被信息所淹没,但我们却由于缺乏知识而感到饥饿。”数据库容量的指数增长和对数据库应用的贫乏形成了强烈的反差,导致了大量的数据垃圾。由于大量的历史数据分布在不同的系统平台上,具有多种存储形式,放在不同的数据库中,难以综合访问,因而有人把这些数据称为“数据坟墓”。
另一方面,作为企业的领导和决策者希望从这些复杂的数据中得到有用决策数据。
比如,超市的经营者希望知道哪些商品被同时购买,以便把它们放在一起,以增加销售;保险公司想知道购买保险的客户一般具有哪些特征,那类人是它们的最大客户群;医学研究人员希望从已有的成千上万份病例中找出患某种疾病的病人的共同特征,从而为治愈这种疾病体提供一些帮助等等。
对于这些问题,现有的管理信息系统中的数据分析工具很难给出答案,即传统的数据库应用系统并不能很好的支持决策,因为它是面向业务操作设计的,无论是查询、统计还是生成报表,其处理方式都是对指定的数据进行简单的数字处理。不能对这些数据所包含的内在信息进行提取。因此,企业需要新的技术来弥补原有数据库系统的不足。
一、数据仓库概念的提出
如何有效的管理公司和企业在运营过程中产生的大量数据和信息一直是IT业面临的重要问题。20世纪70年代出现的关系数据库为解决这一问题提供了强有力的工具,从20世纪80年代中期开始,随着市场竞争的加剧,信息系统用户不满足仅仅用计算机处理日复一日的运营数据,他们更需要的是从这些数据中得到有用的信息,以便于进行决策支持。这种需求使得在20世纪80年代后期出现了数据仓库思想的萌芽。
1988年Devlin和Murphy发表了一篇关于数据仓库论述的最早文章。
1992年william 在《Building the Data Warehouse》一书中首先系统的阐述了关于数据仓库的思想、理论,从此数据仓库的研究和应用得到了广泛的关注,因而Inmon被人们尊称为“数据仓库之父”。
人们为什么不能在原数据库上作决策,而一定要建造数据仓库呢?
传统数据库对日常事务处理(联机事务处理)(On Line Transaction Process OLTP)十分理想,但是要给予事务处理的数据库帮助决策分析就产生了很大得困难,其原因主要是传统数据库的处理方式和决策分析中的数据需求不相称,主要表现在:

在OLTP中,用户对系统和数据库的要求是数据存取频率要高,操作时间要快,由于用户对数据操作时间的短暂,是系统在多用户的情况下,也可保持较高的系统响应时间。例如银行存取系统,银行联网运行实例。
在决策分析处理中,用户对系统和数据的要求则发生了很大的变化。在决策分析中,有的决策问题请求可能导致系统长达数小时的