文档介绍:四川移动
准沉默客户识别模型
分析设计说明书
版本号
项目名称
四川移动准沉默客户模型建设
文档名称
四川移动准沉默客户模型分析设计说明书
版本号
发布日期
文档变更记录
版本
修改章节
修改类型
日期
修改人
备注
目录
1. 模型概述 1
2. 业务理解与目标定义 1
模型定义 1
目标定义 1
3. 数据准备与数据探索 2
数据准备 2
数据探索 7
4. 模型构建 8
建模工具 8
建模流程 8
5. 模型评估 9
模型评估 9
结果解释 10
6. 模型部署 12
附录 12
模型概述
沉默客户的存在,不仅造成了资源的大量浪费,也为市场运营及营销工作带来了困难,同时,也造成了离网用户的大量增加和挽留难度的大幅提升。
准沉默客户识别模型的目标在于为营销工作提供决策参考,协助需求部门有效的进行营销前移,通过沉默客户预判工作,在客户接触点尚未消失前进行针对性的营销及挽留相关工作,保证其资源利用和效率提升,进一步深入进行市场精细化运营。
由于最后一次通话状态和用户在网时长在用户沉默原因上的差异性较明显,如最后一次通话为漫游状态的用户一般认为是自然流失客户,如网3个月以内的号码稳定性一般较差,受渠道、SP厂商的影响也较大。因此,在进行模型建设的具体工作的之前,结合业务经验及具体数据分析,为使模型结果更能够符合实际使用需要,将准沉默客户细分成三类:最后一次通话为漫游的客户、最后一次通话非漫游且在网时长3个月以内的客户和最后一次通话非漫游且在网时长3个月以上的客户,针对每一类客户均建立了预测模型。
业务理解与目标定义
模型定义
沉默客户定义:指上月上网本月未上网的客户
上网客户定义:当月产生语音、短信、GPRS等话单的客户
净增客户定义:当月上网客户数减去上月上网客户数
目标定义
建立准沉默客户识别预测模型并且产生最可能的目标客户的名单,结合每个客户的价值评分,用0到1之间的值来量化目标客户的可能性大小。
数据准备与数据探索
数据准备
基础变量表:
字段名
数据类型
解释
ID_NO_1
BIGINT
用户编码
PHONE_NO_1
VARCHAR(20)
手机号码
RUN_NAME
VARCHAR(32)
截止提数日用户状态
RUN_CODEOLD
CHARACTER(10)
截止提数日用户状态编码
GROUP_ID
VARCHAR(32)
入网渠道编码
GROUP_NAME
VARCHAR(300)
入网渠道名称
AREA_NAME
VARCHAR(32)
归属地市
COUNTY_NAME
VARCHAR(64)
归属区县
OPEN_TIME
VARCHAR(20)
入网时间
SM_CODE
CHARACTER(10)
资费代码
BRAND_NAME
VARCHAR(100)
品牌名称
MODE_NAME
CHARACTER(100)
资费名称
VIPFLAG
INTEGER
vip客户标记
VIP_CLASS
VARCHAR(10)
vip客户等级
GRPFLAG
INTEGER
归属集团编码
GRP_NAME
VARCHAR(300)
归属集团名称
HIGHFLAG
INTEGER
中高端客户标记
ALLDURATION05
INTEGER
总通话时长
ALLCALLTIMES05
INTEGER
总通话次数
ALLDURATION04
INTEGER
上月通话时长
ALLCALLTIMES04
INTEGER
上月总通话次数
ALLDURATION03
INTEGER
上上月通话时长
ALLCALLTIMES03
INTEGER
上上月总通话次数
BDDURATION05
INTEGER
本地通话时长
BDCALLTIMES05
INTEGER
本地通话次数
BDDURATION04
INTEGER
上月本地通话时长
BDCALLTIMES04
INTEGER
上月本地通话次数
BDDURATION03
INTEGER
上上月本地通话时长
BDCALLTIMES03
INTEGER
上上月本地通话次数
CTDURATION05
INTEGER
长途通话时长
CTCALLTIMES05
INTEGER
长途通话次数
CTDURATION04
INTEGER
上月长途通话时长
CTCALLTIMES04
INTEGE