1 / 18
文档名称:

数据挖掘81469.ppt

格式:ppt   页数:18页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘81469.ppt

上传人:cdsqbyl 2015/5/25 文件大小:0 KB

下载得到文件列表

数据挖掘81469.ppt

文档介绍

文档介绍:目录
数据挖掘
数据挖掘
数据库越来越大
有价值的知识
可怕的数据
数据爆炸但知识贫乏
数据挖掘
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
数据挖掘的基本应用
对象分类
自动预测
关联分析
聚类分析
可视化
数据挖掘应用—分类
按照分析对象的属性、特征,建立不同的组类来描述事物。
例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。
数据挖掘应用—预测
数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。
一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。
数据挖掘应用—关联分析
数据关联是数据库中存在的一类重要的可被发现的知识。
若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。
例如:每天购买啤酒的人也有可能购买香烟,比重有多大,可以通过关联的支持度和可信度来描述。
时序关联是一种纵向的联系。例如:今天银行调整利率,明天股市的变化。
数据挖掘应用—聚类
数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。
数据挖掘应用—可视化
用图表等方式把数据特征用直观地表述出来,如直方图等,这其中运用了许多描述统计的方法。
信息可视化能极大地发挥用户的主动参与性。由于对数据进行了可视化,用户愿意进行探索,在探索过程中有可能发现意外的知识。
数据挖掘的流程