文档介绍:2016-9-91Data Mining CookbookData Mining Cookbook主讲:夏燕 032021145计算机与信息技术系2016-9-92目录目录————计划菜单计划菜单?引言?设立目标?定义目标?选择建模方法?自适应公司?选择数据源?数据类型与数据源?选择建模数据?构造建模数据集2016-9-93数据清洗变量规约与转换模型处理、验证、实施引引言言基础知识模型开发的各步骤案例研究?建立有效数据模型的步骤Marketing risk & CRM?用于Data Mining的多种类型和来源的数据2016-9-94设立目标设立目标?二战后若干年,竞争侵蚀利润,产生target marketing需要定位模型定位模型定位模型定位模型?Target model :帮助定位最佳客户和潜在客户信息的可用性信息的可用性计算机功能的增加计算机功能的增加营销定位营销定位营销定位2016-9-95定义目标定义目标?描述模型 (descriptive model)?描述模型 (descriptive model)?预测模型(predictive model)?预测模型(predictive model)吸引、保留客户商业目标分析术语?特征分析?划分根据利润和市场潜力划分客户,share of wallet,风险和存款余额?响应目标是预测谁会对某种产品的宣传做出响应,监视响应途径管理重复响应2016-9-96?风险银行业,金融业,其他行业。欺诈(fraud):欺诈检测模型?激活潜在的用户会否成为成熟用户;建立预测响应模型、一步建模的方法?交叉销售和提升销售?流失建立模型能预测账号在被激活后减少或停止使用一种产品或服务的行为?净现值模型试图预测产品在预定的时间范围内的总体利润?生命周期价值模型试图预测客户在预定时间长度内的总体利润2016-9-97选择建模方法选择建模方法模型处理的步骤比用于建模的技术更重要。用于开发预测和描述模型的工具统计方法线性回归多元线性回归逻辑回归简单线性回归混合方法神经网络遗传算法分类树回归树2016-9-98线性回归线性回归独立变量依赖变量Simple linear regression analysis 量化两个连续变量之间的关系的统计技术发现一条穿过数据的线,线上的点使对应数据点的方差最小2016-9-99线性回归线性回归独立变量依赖变量转换独立变量,达到更好的适应。2016-9-910线性回归线性回归独立变量依赖变量用多个预测或独立连续变量来预测一个连续变量为多元线性回归multiple linear