文档介绍:摘要数据挖掘是当前国际学术界一项前沿的研究课题,它是一个多学科领域。涉及了数据库技术、人工智能、机器学习、知识获取等诸多领域。也被称之为数据库中知识发现,是自动的或方便的模式提取,这些模式代表隐藏在大型数据库、数据仓库中的知识。分类是数据挖掘的重要内容之一,己广泛应用于如医疗诊断、天气预测、顾客区分、欺诈甄别等领域。挖掘分类模式的方法有多种,如决策树方法、贝叶斯网络、遗传算法等等。其中决策树方法最为广泛。是一种归纳学习算法,先从所有的事例中选取一部分构造决策树,再用剩下的事例测试决策树并对它进行调整。它不仅能处理连续值类型的属性,还可以对属性的取值集合进行等价类划分,划分在同一类的属性值在属性值判断时走向同一分支。本文将数据挖掘算法引入客户流失分析的研究中。开发新客户和保持老客户是任何企业提高竞争力的关键,目前很多企业对客户流失的分析是粗略的或者根据经验判断,利用面向属性归纳和决策树惴ǘ酝缈突Щ拘畔⒔蟹析,找出客户流失的特征,有利于针对性地改善客户关系。本课题首先详细介绍了数据挖掘概念、数据挖掘技术、应用领域等。其次对决策树分类方法进行了系统、深入的分析研究。对客户提交的友情反馈信息进行整理、清洗、分类,并采用决策树算法对其进行分析,提取规则,同时使用剪枝阀值对决策树进行剪枝优化,最终生成一棵较理想的决策树,为判断客户是否存在流失风险的预测构造系统,在经过处理数据的基硒上生成了一系列客户流失预测规则。本课题是在环境下,使用语言,连接数据库进行开发的。主要实现了数据预处理、数据分析、模型验证、数据流失性预测四大功能模块,在本文对其进行了简单界面演示,以便非专业人员对决策树生成有个更直观的了解。同时还对模型在极其成熟的软件中的实现进行了阐述、验证,以证实该模型的正确性。最后通过实例对模型的有效性进行了验证。关键词:客户流失:数据挖掘:决策树伽\
琱..,,猻瑆.,,瓺,甀瑂瑆,琯.,.,,..,,瓵猳,琣.
琣.,.,希瓼,,—琣,,篊篋:
第一章绪论研究“客户流失谋尘坝胍庖.裁词恰翱突Я魇А客户关系管理旨在通过一个尽可能自动化和持续的过程,最大化的了解和利用客户的各种信息,把合适的产品和服务通过合适的渠道,在恰当的时机,提供给适当的客户,从而有效地提高客户满意度,提升客户对公司的忠诚度,并同客户保持长期的、高收益的业务关系。客户关系管理一般分为三种类型:操作型:为了更好的服务客户,快捷的响应客户需求,它要求实现所有业务流程的流线化和自动化,包括多渠道客户“接触点“的有效整合,以及前台和后台运营系统之间平滑的相互连接和整合。:着重于通过技术手段实现高质量的客户接触和高效率的客户信息收集,将多种与客户交流、交互的渠道紧密集成,同时利用操作型髌笠蹈鞑棵牛繁?突Ч低ㄇ赖谋憬荨⒁恢隆分析型:主要是从操作型托餍虲中获取的各种数据,为企业的经营、新市场的开发以及战略、战术的制定提供可靠的量化分析依据。分析型婕暗闹饕N侍庥校嚎突禾宸掷喾治龊托形7治觥⒖突б娣析和预测、客户满意度分析、交叉营销和升级营销、产品及服务使用分析、客户信用分析、客户流失分析、欺诈发现等等。客户流失概念界定对于不同行业有一定差别,一般是指用户不再重复购买、或终止原先使用的服务。由于各种因素的不确定性和市场不断的增长以及一些竞争对手的存在,很多用户不断地从一个供应商转向另一个供应商只是为了求得更低的费用以及得到更好的服务,这种用户流失在许多企业中是普遍存在的问题。根据客户流失类型可分为主动流失和被动流失。被动流失是指公司主动放弃的客户,被动流失主要是由客户的欺诈行为、拖欠或滥用服务等因素所致:主动协同型
流失是客户流失管理的重点,主动流失又分为无意流失和蓄意流失。无意流失是由客户地点变更、财务变化或生活巨变等因素引起的,无意流失往往只占主动流失的一小部分。蓄意流失是流失预测建模要识别的目标对象,主要受企业产品或服务的技术因素、经济因素等影响。客户在一个网站中一般会经历新鲜期一沉迷期一消退期一离开网站四个阶段。绾文芄谎映び没г谕镜耐A糁芷谑瞧笠等嗽毙枰F惹薪饩龅奈侍狻J想,如在用户消退期到达之前能够使用某种方法接着使用户重新进入新鲜期或者沉迷期,从而降低用户的流失。这比重新挖掘、吸引新客户的成本应该更低。要完成流失用户的预测,我们首先需要确定以下三点:什么叫做流失裁唇凶稣各个行业对于客户流失的定义有所不同,例如在电信行业指的是客户从一个运营商转到另一个运营商或者每月平均消费量下降。在当今流行的电子商务网络购物系统中,我们可以从客户的订单量来定义客户的流失。本课题订餐管理系统中,决策人把一个月内下单量比前一个月下单量减少%及以上的客户定义为“流失客户’’,其余的为“未流失客户“。要分析哪些用户本课题分析的用户包括所有在本网站提交过订餐订单及反馈意见表的客户。分析窗口和预