1 / 93
文档名称:

数据挖掘概述课件.ppt

格式:ppt   大小:962KB   页数:93页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘概述课件.ppt

上传人:wwlgqnh 2022/7/30 文件大小:962 KB

下载得到文件列表

数据挖掘概述课件.ppt

文档介绍

文档介绍:经济数据挖掘与分析
第1章 数据挖掘概述
*
王耀东
上海财经大学
第1页,共93页。
第1章 数据挖掘概述
*
数据挖掘定义
数据挖掘的重要性及意义
数据挖掘功能
数据挖掘步骤和标准
1s.
第17页,共93页。
Bhavani (1999)的定义
*
Data Mining is the process of posing various queries and extractions useful information,patterns,and trends often previously unknown from large quantities of data possibly stored in databases.
数据挖掘是从储存在数据库的大量数据资料中,设置盘问,提取以前未知的信息、模式和趋势的方法。
第18页,共93页。
Bhavani(1999)的定义
*
The process of discovering meaningful new correlation,patterns,and trends by sifting through large amount of stored data,using pattern recognition technologies and statistical and mathematical techniques
数据挖掘是从大量储存的数据中,利用模式识别、统计和数学的技术、筛选发现新的有意义的关系、模式和趋势的方法。
第19页,共93页。
Kovalerchuk & Evgenii Vityaev的定义
*
These techniques are now applied to discover hidden trends and patterns in financial databases
这些技术现在用于发现潜藏在金融数据库中的趋势与模式
第20页,共93页。
Berry and Linoff (1997)
*
分析报告给你的是后见之明(hindsight);
统计分析给你的是先机(foresight);
数据挖掘给你识见(insight)。
第21页,共93页。
数据挖掘所要处理的问题
*
在庞大的数据库中寻找出有价值的隐藏事件,加以分析,并将这些有意义的信息归纳成结构模式,作为企业在进行决策时之参考。
数据挖掘看重的是数据库的再分析,包括模式的建构或是资料特征的判定,其主要目的就是要从数据库中发现先前关心却未曾获悉的有价值信息(Hand,1998)。
事实上,数据挖掘并不只是一种技术或是一套软件,而是数种专业技术的综合应用。
第22页,共93页。
数据挖掘 找寻隐藏在资料中的信息
*
趋势(Trend)
特征(Pattern)
关系(Relationship)的过程,
第23页,共93页。
从资料中发掘信息或知识 (有人称为Knowledge Discovery in Databases,KDD)
*
“资料考古学”(Data Archaeology)
“资料模式分析”(Data Pattern Analysis)
“功能相依分析”(Functional Dependency Analysis),
第24页,共93页。
数据挖掘
*
目前已被许多研究人员视为结合数据库系统与机器学****技术的重要领域,许多产业界人士也认为此领域是一项能增加企业潜能的重要途径。
这一领域蓬勃发展的原因是因为现代的企业已搜集了大量资料,包括市场、客户、供货商、竞争对手以及未来趋势等重要信息,但是数据的超载与无结构化,使得企业决策单位无法有效利用现存的资料,甚至会使决策行为产生混乱与误用。
如果能通过数据挖掘技术,从巨量的数据库中,采掘出不同的信息与知识出来,作为决策支持之用,就一定能成为企业竞争的优势。
第25页,共93页。
数据挖掘的软件工具
*
有些销售得还相当火爆,但是,对于这种数据挖掘的产品应该有一个正确的认识,就是它不是一个无所不能的魔法。
它不是在那边监视你的资料的状况,然后告诉你说你的数据库里发生了某种特别的现象。
也不是说有了数据挖掘的工具,就连不了解业务、不了解资料所代表的意义、或是不了解统计原理的人也可以做数据挖掘。
数据挖掘所采掘出来的信息,也不是你可以不经确认,就可以照单全收应用到业务上的。
事实上,数据挖掘工具是用来帮助业务分析策画人员从资料中发掘出各种假设(