1 / 14
文档名称:

数据仓库与数据挖掘的综述资料.docx

格式:docx   大小:138KB   页数:14页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘的综述资料.docx

上传人:guoxiachuanyue 2021/3/1 文件大小:138 KB

下载得到文件列表

数据仓库与数据挖掘的综述资料.docx

相关文档

文档介绍

文档介绍:Southwest university of science and technology
数据挖掘课程报告
数据仓库与数据挖掘的综述




计算机科学与技术




计科










吴珏
二◦一六年11月
摘要
通过对数据仓库与数据挖掘的学****和大致的了解 , 主要提出了一 种基于数据仓库的数据挖掘系统的决策支持系统的框架。 该文章把数 据仓库、数据挖掘工具和知识库结合在一起, 提高了数据挖掘的效率。 增加了挖掘数据的效率和价值实用性!
一、概述
近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提 高,千万万个数据库被用于商业管理、政府办公、科学研究和工程开 发等等,并且这一势头仍将持续发展下去。于是,一个新的挑战被提 了出来: 在这被称之为信息爆炸的时代,信息过量几乎成为人人需要 面对的问题。 如何才能不被信息的汪洋大海所淹没, 从中及时发现有 用的知识,提高信息利用率呢 ?要想使数据真正成为一个公司的资源, 只有充分利用它为公司自身的业务决策和战略发展服务才行, 否则大 量的数据可能成为包袱,甚至成为垃圾。因此,面对 " 人们被数据淹 没,人们却饥饿于知识的挑战,数据挖掘和知识发现(DMKD技术应运 而生,并得以蓬勃发展,越来越显示出其强大的生命力。
数据挖掘 (Data Mining) 就是从大量的、不完全的、有噪声的、模 糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又 是潜在有用的信息和知识的过程。还有很多和这一术语相近似的术 语,如从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion) 以及决策支持等。 人们把原始数据看作是形成知识的源泉, 就像从矿 石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据, 也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络 上的异构型数据。 发现知识的方法可以是数学的, 也可以是非数学的 ; 可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、 查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因 此,数据挖掘是一门很广义的交叉学科, 它汇聚了不同领域的研究者, 尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学 者和工程技术人员。
数据仓库,英文名称为Data Warehouse,可简写为DV或DWH数据 仓库,是为企业所有级别的决策制定过程, 提供所有类型数据支持的 战略集合。 它是单个数据存储, 出于分析性报告和决策支持目的而创 建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、 成本、质量以及控制。
今天, 越来越多的企业认识到要从以往的事务处理和决策中总结 经验,利用现有的数据进行分析和推理,建立企业的决策支持系统
(DSS以提高决策的质量。企业如果不能快速精确的收集和分析信 息,将无法进行科学而有效的决策。建立数据仓库 (Data warehouse) 将能很的解决这一问题, 使企业从大量的业务信息中筛选出所需的信 息,并做出正确的决策。数据仓库不是单一的产品, 而是综合了多 种信息技术的计算环境。 它将全企业的运行数据汇集到一个精心设计 的关系数据库中, 并将它们转换成面向主题 (Subject-oriented) 的形 式,使最终用户很容易的从历史的角度对这些数据进行访问和分析。 以银行为例, 通常,银行的应用系统是按业务分类的, 如储蓄、信贷、 信用卡等, 一个客户的信息分布在不同的业务系统中, 要想得到一个 客户的全面信息非常困难。银行通过建立数据仓库, 可以将分离在 各个业务系统中的数据合并成一个统一的图表, 这样就可以看到客户 在各个系统中的全貌,而且可以从历史的角度对客户档案进行分析, 以便做出为每一个客户进一步服务的决策。
二、数据仓库和数据挖掘的基本概念
数据仓库和数据挖掘的关系: 数据仓库和数据挖掘都是数据仓库 系统的重要组成部分 , 它们既有联系 , 又有区别。
联系是:
数据仓库为数据挖掘提供了更好的、更广泛的数据源。
数据仓库为数据挖掘提供了新的支持平台。
数据仓库为更好地使用数据挖掘这个工具提供了方便。
数据挖掘为数据仓库提供了更好的决策支持。
数据挖掘对数据仓库的数据组织提出了更高的要求。
数据挖掘还为数据仓库提供了广泛的技术支持。
区别是:
数据仓库是一种数据存储和数据组织技术 , 提供数据源。
数据挖掘是一种数据分析技术 , 可针对数据仓库中的数据进行 分析。
数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而 变的、持久的数据集合。 数据仓库系统负责从操作型数据库中抽