1 / 48
文档名称:

数据挖掘 3.ppt

格式:ppt   大小:335KB   页数:48页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘 3.ppt

上传人:unnwldv331 2018/2/26 文件大小:335 KB

下载得到文件列表

数据挖掘 3.ppt

文档介绍

文档介绍:《数据挖掘》
广东技术师范学院计科系叶海山

《数据挖掘概念与技术》
作者: (加)JIAWEI HAN MICHELINE KAMBER
出版社: ***出版社
网站
1、数据仓库之路/
2、数据挖掘讨论组/
3、数据挖掘研究研/
2
第1章绪论
初识数据挖掘
初识数据仓库
进一步理解数据挖掘
数据挖掘应用实例
数据挖掘的发展趋势
3
第1章绪论
数据挖掘(Data mining, DM)技术是一门综合性的技术领域,主要涉及数据库、人工智能和数理统计3个技术领域。
4
第1章绪论
初识数据挖掘

产生的前提:从大量数据中找出隐藏在其中的、有用的信息和规律;计算机技术和信息技术的发展使其有能力处理这样大量的数据。
5
第1章绪论

应用数据挖掘从大量数据中所发现的规律并不是“放置四海而皆准”的规律,而是面向某一应用的规律,具有具体的指导意义。
成功例子:
零售业的沃尔马“啤酒与尿布”规律
Google
中国宝山钢铁公司1995年开始利用数据挖掘技术提高热轧产品质量、合理配矿
中国铁道部1998年开始利用数据挖掘技术分析春运期间的铁路客流量,挖掘影响铁路客运总量的关键因素
……
6
第1章绪论

八十年代人工智能(AI)研究项目失败后,转入实际应用时提出的。
1989年国际上第一次关于数据挖掘与知识发现的研讨会在美国的底特律召开,在此次会议上第一次提出了知识发现(Knowledge Discovery in Database, KDD)一词。
1995年,在加拿大召开了第一届KDD和DM国际学术会议。会议对KDD做了确切的定义。
从九十年代中后期开始,KDD和DM已成为研究的热点和焦点。
7
8
第1章绪论
数据挖掘的定义
数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
原始数据可以是结构化的也可以是半结构化的。
发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。
9
第1章绪论
初识数据仓库
数据仓库的产生
1988年IBM爱尔兰公司第一次提出了“信息仓库”的概念。
90年代初数据仓库的基本原理、框架架构,分析系统的主要原则都已经确定,主要的技术已具备,一些公司开始建立数据仓库。
92年美国著名的信息工程学家William 在《Building the Data Warehouse》(《建立数据仓库》)一书中首先系统的阐述了数据仓库的思想、理论。被人们尊称为“数据仓库之父”。
10