文档介绍:数据挖掘与Clementine使用培训
北京瑞斯泰得数据技术开发有限公司
11/10/2017
0
一、数据挖掘概述
什么是数据挖掘
数据挖掘的实现路线和流程
数据挖掘方法论——CRISP-DM
1
为什么进行数据挖掘? 商业观点
业务中产生了大量的数据,这些数据存储在业务系统中却不能创造价值
客户信息数据
客户交易行为数据
客户反馈数据
网络数据
……
计算机变得越来越便宜、功能却越来越强大
商业竞争越来越激烈,对客户了解越多就意味着机会越大
2
为什么进行数据挖掘? 技术观点
业务中的数据量呈现指数增长(GB/小时)
传统技术难以从这些大量数据中发现有价值的规律
数据挖掘可以帮助我们从大量数据中发现有价值的规律
The Data Gap
Total new disk (TB) since 1995
Number of analysts
From: R. Grossman, C. Kamath, V. Kumar, “Data Mining for Scientific and Engineering Applications”
3
一个市场营销的例子
在数据中发现有价值的规则或者模式
女性对市场活动做出回应,男性对市场活动不做出回应,和年龄无关
4
一个市场营销的例子
数据变的复杂会如何?
女性对市场活动做出回应,老年男性也可能对市场活动做出回应
5
一个市场营销的例子
数据挖掘可以从异常复杂的数据中发现规律
通过数据挖掘发现回应的5条规则:
1、如果收入大于29622,有孩子,并且孩子的数量小于等于2,那么对市场活动会回应
……
通过数据挖掘发现不回应的5条规则:
1、,并且有一个孩子,那么对市场活动不会回应
……
6
数据挖掘收益分析
向60%的客户发信,得到了90%的收益
数据挖掘的意义
7
利润分析图
8
数据挖掘效果模拟分析
数据挖掘以前
数据挖掘以后
差别
发信的数量
1,000,000
750,000
(250,000)
成本
$1,000,000
$750,000
($250,000)
响应的数量
10,000
9,000
(1,000)
每个响应的收入
$125
$125
$0
总收入
$1,250,000
$1,125,000
($125,000)
净利润
$250,000
$375,000
$125,000
建模的费用
0
40,000
$40,000
最终的利润
$250,000
$335,000
$85,000
目的:发现新客户(使响应率从1%%)
9