文档介绍:TeradataTM Warehouse MinerTraining Workshop案例-2 流失客户聚类分析
为什么进行客户流失聚类分析?
移动服务的竞争进入白热化状态
%
月租型, 拆机用户聚类分析结果
将拆机用户分类,并找出各类的特征
顺水推舟型(35%)
我爱中国型(20%)
老大心态型(16%)
精打细算型(12%)
恶意预谋型(9%)
计划离网型(7%)
针对分类特征制定相应决策
专题概要
数据仓库
Partly adapted from Fayyad U. M., Piatetsky-Shapiro, P. Smith (1995), ‘From Knowledge Discovery to Data Mining: An Overview’ in
Advanced Knowledge Discovery and Data Mining.
选择& 抽样
模型评估&
验证
建模
数据探索&
数据转换
数据清洗&
预处理
确定&理解业务问题
数据的
后续处理
知识
预备建模
数据挖掘方法论
以客户编号为单位
在网时间大于90天
有效的身份证件
客户类型为“单位”或“个人”
正常用户
状态为’正常’
状态为‘停话’
状态为‘预销’,‘预拆’,‘强开’
流失客户
状态为’拆机’
流失客户的定义
市场计划
市场调查
新客户
计费
网络
销售网络
合同/
买卡
神州行
上线中心
客服
传真/电话
电脑联网
(直营)
客服
查询/抱怨/
停话/催缴
异常
营业网点
客户
使用
账单
营业网点/
银行等
缴费
缴费
退户
催缴
更换/
维修
销售/营业
网点
项目
行销
资费
优惠项目
拆
机
业务理解
客户数据
合约属性
交互行为
客户忠诚度
支付行为
使用行为
近一个月缴费额
近1~3月总缴费额
近4~6月总缴费额
近7~9月总缴费额
六个月通话移动平均
六个月通话移动差
九个月通话移动平均
九个月通话移动差
受话次数/秒数
受话号码数
发话次数/秒数
拨打号码数
发短消息次数
话转比例
漫游次数
网内拨打比例
拨打固话次数
拨打简码次数
通话异常中断次数
迟缴次数
欠缴金额
催缴次数
催缴成功次数
累计积分数
已兑换次数
已兑换分数
兑换类别
限话次数
联络次数
接触次数
接触类别
抱怨次数
查询销号离网次数
资费套餐变动
IMSI_DN更换次数
客户状态变化情况
使用期
年龄
资费套餐
所属地区
缴费方式
性别
合约多号码
客户类型
证件多号码
开通类型
行业类别
拆机用户聚类分析的数据来源
数据质量问题
选择20元月租全球通,神州通等资费套餐
有过一次资费套餐调整的客户
在X地区,L地区的用户流失倾向较高
从代理点或代办点入网的客户
在网时间少于15个月
23-26岁左右的年轻族群流失比例高
曾经被停话的客户
本月出帐金额小于15元
近三月平均出帐金额小于40元
近六月平均出帐金额小于60元
积分小于50
拆机客户特征…
三个月内发话
次数小于30
号码个数小于12
费用小于10元
三个月内拨打市话短于5分钟,发话时间短于15分钟
三个月内发送短信不超过1次
三个月内受话
次数小于10
号码个数小于6
费用小于5元
时间短于5分钟
与他网通话次数为0
拆机客户特征(续)
衍生变量&数据重新编码