文档介绍:第11讲 数据挖掘概述Chapter 11 Introduction to Data Mining
徐从富(Congfu Xu), PhD, Asso. Professor
浙江大学人工智能研究所
2005年5月17日第一稿
2种新的产品,需要通过直邮的方式向客户推荐这种产品。。。。。。
使直邮的回应率提高了100%
电信
整理课件
GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本。。。。。。
%
零售商店
整理课件
美国国内税务局需要提高对纳税人的服务水平。。。。。。
合理安排税务官的工作,为纳税人提供更迅捷、更准确的服务
税务局
整理课件
银行
金融事务需要搜集和处理大量的数据,由于银行在金融领域的地位、工作性质、业务特点以及激烈的市场竞争决定了它对信息化、电子化比其它领域有更迫切的要求。利用数据挖掘技术可以帮助银行产品开发部门描述客户以往的需求趋势,并预测未来。美国商业银行是发达国家商业银行的典范,许多地方值得我国学****和借鉴。
整理课件
数据挖掘在银行领域的应用
美国银行家协会(ABA)%。
分析客户使用分销渠道的情况和分销渠道的容量 ;建立利润评测模型;客户关系优化;风险控制等
整理课件
Mellon银行使用数据挖掘软件提高销售和定价金融产品的精确度,如家庭普通贷款。
美国Firstar银行使用数据挖掘工具,根据客户的消费模式预测何时为客户提供何种产品。
整理课件
汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户。。。。。。
营销费用减少了30%
银行
整理课件
基本概念区分
数据挖掘与知识发现
数据挖掘和数据仓库
数据挖掘与信息处理
数据挖掘与联机分析
数据挖掘与人工智能、统计学
整理课件
数据挖掘和知识发现
数据挖掘(Data Mining)从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与之相似的概念称为知识发现。
知识发现(Knowledge Discovery in Databases)是用数据库管理系统来存储数据,用机器学****的方法来分析数据,挖掘大量数据背后隐藏的知识,称为数据库中的知识发现。
整理课件
数据挖掘和数据仓库
大部分情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中。从数据仓库中直接得到进行数据挖掘的数据有许多好处。数据仓库的数据清理和数据挖掘的数据清理差不多,如果数据在导入数据仓库时已经清理过,那很可能在做数据挖掘时就没必要再清理一次了,而且所有的数据不一致的问题都已经解决了。
整理课件
数据源
数据仓库
各分公司
数据集市
分 析
数据集市
数据挖掘
数据集市
整理课件
数据挖掘库可能是数据仓库的一个逻辑上的子集,而不一定非得是物理上单独的数据库。但如果数据仓库的计算资源已经很紧张,那么最好还是建立一个单独的数据挖掘库。
当然为了数据挖掘也不必非得建立一个数据仓库,数据仓库不是必需的。建立一个巨大的数据仓库,把各个不同源的数据统一在一起,解决所有的数据冲突问题,然后把所有的数据导到一个数据仓库内,是一项巨大的工程,可能要用几年的时间花上百万的钱才能完成。只是为了数据挖掘,你可以把一个或几个事务数据库导到一个只读的数据库中,就把它当作数据集市,然后在它上面进行数据挖掘。
数据源
数据挖掘库
整理课件
数据挖掘与信息处理
信息处理
信息处理基于查询,可以发现有用的信息。但是这种查询的回答反映的是直接存放在数据库中的信息。它们不反映复杂的模式,或隐藏在数据库中的规律。
整理课件
数据挖掘与联机分析
OLAP分析过程在本质上是一个演绎推理的过程,是决策支持领域的一部分。传统的查询和报表工具是告诉你数据库中都有什么(what happened),OLAP则更进一步告诉你下一步会怎么样(What next)和如果采取这样的措施又会怎么样(What if)。用户首先建立一个假设,然后用OLAP检索数据库来验证这个假设是否正确。
数据挖掘在本质上是一个归纳推理的过程,与OLAP不同的地方是,数据挖掘不是用于验证某个假定的模式(模型)的正确性,而是在数据库中自己寻找模型。
数据挖掘和OLAP具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,OLAP工具能起辅助决策作用。而且在知识发现的早期阶段,OLAP工具用来探索数据,找到哪些是对一个问题比较重要的变量,发