1 / 64
文档名称:

7数据仓库和数据挖掘课件.ppt

格式:ppt   大小:2,365KB   页数:64页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

7数据仓库和数据挖掘课件.ppt

上传人:aluyuw1 2022/10/20 文件大小:2.31 MB

下载得到文件列表

7数据仓库和数据挖掘课件.ppt

相关文档

文档介绍

文档介绍:该【7数据仓库和数据挖掘课件 】是由【aluyuw1】上传分享,文档一共【64】页,该文档可以免费在线阅读,需要了解更多关于【7数据仓库和数据挖掘课件 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。第7章数据仓库和数据挖掘
本章学****目标
了解数据仓库的概念及特点
了解数据挖掘的应用和功能
熟悉数据挖掘的几种主要技术
第7章数据仓库和数据挖掘




什么是数据仓库?

始于20世纪80年代初,“数据仓库之父”。
“数据仓库是在企业管理和决策中面向主题的、集成的、相对稳定的、与时间相关的数据集合,以支持经营管理中的决策。
数据仓库用于支持决策,面向分析型数据处理,不同于企业现有的操作型数据库;数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据。

1、面向主题
2、集成的数据
3、数据相对稳定
4、数据仓库的时间相关性
特点
财务子系统
销售商分析
产品分析
销售子系统
供应子系统
人力资源子系统
消费者分析
数据仓库
生产调度子系统
数据库
面向主题
面向事务

(2)集成的数据
从原来分散的多个异种数据源(关系数据库、文本数据库、Web数据库、一般文件等)构成的子系统中提取数据。
①原有数据库系统记录的是每一项业务处理的流水账,不适合分析处理,在进入数据仓库之前必须进行综合、计算,抛弃分析处理不需要的数据项,必要时增加一定的外部数据。
②原分散数据库中有很多重复或不一致的地方,必须消除不一致和错误,全局统一。
为何进行数据集成?

(3)数据相对稳定
数据库:通常定时更新,根据需要变化
数据仓库:主要供查询,只读。
从内容上看,存储当前和历史的数据,不是日常事务产生的数据,并且当前数据在一定时间间隔后要转换成历史数据转存慢速设备,不需要的则删除,因此极少修改。
火车票销售

(4)数据仓库的时间相关性
数据仓库中的数据都要表明时间属性。通常包含历史信息,记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。为了满足决策分析的需要,数据仓库的数据存储期限一般为5~10年,当超过数据仓库的存储期限,或对分析不再有用时,这些数据将从数据仓库中删去。
学籍管理系统&成绩管理系统
财务系统