1 / 36
文档名称:

决策树算法-课件PPT(演示稿).ppt

格式:ppt   页数:36页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

决策树算法-课件PPT(演示稿).ppt

上传人:huiwei2002 2016/4/17 文件大小:0 KB

下载得到文件列表

决策树算法-课件PPT(演示稿).ppt

文档介绍

文档介绍:就业工场数据中心第七章第七章决策树和决策规则决策树和决策规则本章目标本章目标??分析解决分类问题的基于逻辑的方法的特分析解决分类问题的基于逻辑的方法的特性性. . ??描述决策树和决策规则在最终分类模型中描述决策树和决策规则在最终分类模型中的表述之间的区别的表述之间的区别. . ??介绍介绍 算法算法. . ??了解采用修剪方法降低决策树和决策规则了解采用修剪方法降低决策树和决策规则的复杂度的复杂度. .就业工场数据中心??决策树和决策规则是解决实际应用中分类决策树和决策规则是解决实际应用中分类问题的数据挖掘方法。问题的数据挖掘方法。??一般来说,分类是把数据项映射到其中一一般来说,分类是把数据项映射到其中一个事先定义的类中的这样一个学****函数的个事先定义的类中的这样一个学****函数的过程。由一组输入的属性值向量过程。由一组输入的属性值向量( (也叫属性也叫属性向量向量) )和相应的类,用基于归纳学****算法得和相应的类,用基于归纳学****算法得出分类。出分类。??学****的目标是构建一个分类模型,通常也学****的目标是构建一个分类模型,通常也叫分类器。它可以根据有效的属性输入值叫分类器。它可以根据有效的属性输入值预测一些实体预测一些实体( (所给样本所给样本) )的类。是一个在样的类。是一个在样本其他属性已知的情况下预测另外一个属本其他属性已知的情况下预测另外一个属性性( (样本的类样本的类) )的模型的模型( (分类的结果分类的结果) )。。就业工场数据中心 决策树决策树??从数据中生成分类器的一个特别有效的方从数据中生成分类器的一个特别有效的方法是生成一个决策树。它是一种基于逻辑法是生成一个决策树。它是一种基于逻辑的方法,通过一组输入的方法,通过一组输入- -输出样本构建决策输出样本构建决策树的有指导学****方法。树的有指导学****方法。??决策树包含属性已被检验的节点,一个节决策树包含属性已被检验的节点,一个节点的输出分枝和该节点的所有可能的检验点的输出分枝和该节点的所有可能的检验结果相对应。结果相对应。就业工场数据中心??图图 7-2 7-2 是一个简单的决策树。该问题有两个是一个简单的决策树。该问题有两个属性属性 X,Y X,Y 。。所有属性值所有属性值 X>1 X>1 和和 Y>B Y>B 的样本属的样本属于类于类 2 2。不论属性。不论属性 Y Y的值是多少,值的值是多少,值 X <1 X <1 的的样本都属于类样本都属于类 1 1。。就业工场数据中心??对于树中的非叶节点,可以沿着分枝对于树中的非叶节点,可以沿着分枝继续分区样本,每一个节点得到它相继续分区样本,每一个节点得到它相应的样本子集。应的样本子集。??生成决策树的一个著名的算法是生成决策树的一个著名的算法是 Quinlan Quinlan 的的 ID3 ID3 算法, 算法, 是它改进版。是它改进版。就业工场数据中心?? ID3 ID3 算法的基本思路: 算法的基本思路: 1. ,选从树的根节点处的所有训练样本开始,选取一个属性来划分这些样本。对属性的每取一个属性来划分这些样本。对属性的每一个值产生一分枝。分枝属性值的相应样一个值产生一分枝。分枝属性值的相应样本子集被移到新生成的子节点上。本子集被移到新生成的子节点上。 2. ,直到这个算法递归地应用于每个子节点,直到一个节点上的所有样本都分区到某个类中。一个节点上的所有样本都分区到某个类中。 3. 。分类规则。就业工场数据中心??该算法的关键性决策是对节点属性值的选该算法的关键性决策是对节点属性值的选择。择。 ID3 ID3 和和 算法的属性选择的基础是基算法的属性选择的基础是基于使节点所含的信息熵最小化。于使节点所含的信息熵最小化。??基于信息论的方法坚持对数据库中一个样基于信息论的方法坚持对数据库中一个样本进行分类时所做检验的数量最小。本进行分类时所做检验的数量最小。 ID3 ID3 的的属性选择是根据一个假设,即:决策树的属性选择是根据一个假设,即:决策树的复杂度和所给属性值表达的信息量是密切复杂度和所给属性值表达的信息量是密切相关的。基于信息的试探法选择的是可以相关的。基于信息的试探法选择的是可以给出最高信息的属性,即这个属性是使样给出最高信息的属性,即这个属性是使样本分类的结果子树所需的信息最小。本分类的结果子树所需的信息最小。就业工场数据中心 算法:生成一个决策树算法:生成一个决策树?? 算法最重要的部分是由一组训练样本算法最重要的

最近更新

2024年阜新高等专科学校单招职业适应性测试题.. 56页

2024年黑龙江农业职业技术学院单招职业适应性.. 54页

内蒙古赤峰市事业单位招聘考试(职业能力倾向.. 148页

天津市事业单位招聘考试(职业能力倾向测验).. 148页

山东省泰安市选调生考试(行政职业能力测验).. 147页

山西省晋城市事业单位招聘考试(职业能力倾向.. 145页

江苏省徐州市选调生考试(行政职业能力测验).. 147页

河北省唐山市事业单位招聘考试(职业能力倾向.. 148页

河北省沧州市事业单位招聘考试(职业能力倾向.. 148页

河南省鹤壁市选调生考试(行政职业能力测验).. 147页

分析临床医学专业认证自评报告对学科竞争力的.. 27页

冷沉淀治疗老年失眠的临床效果评估 23页

冷沉淀对肺癌患者生存期的影响分析 27页

冷沉淀在心脏瓣膜疾病早期诊断中的应用成果 27页

2024年足球知识题库【最新】 12页

2024年足球知识题库附答案(a卷) 12页

中国历史文化知识竞赛100题精品(突破训练) 14页

县乡教师选调考试《教师职业道德》题库带答案.. 42页

县乡教师选调进城考试《教育心理学》题库及答.. 121页

县乡教师选调进城考试《教育法律法规》题库及.. 127页

县乡教师选调进城考试《教育法律法规》题库(.. 130页

冠状动脉搭桥术后护理问题解答 27页

冠状动脉搭桥手术后的全面检查时间安排 28页

单位空调维修合同 2页

2023年大学试题(大学选修课)-创业:道与术考考.. 12页

电路分析简明教程 习题答案(傅恩锡第三版).. 56页

领导在巡察组巡察反馈会上的讲话 5页

内镜培训试题 7页

并联式混合动力汽车的能量管理系统研究-工程硕.. 75页

智能灌溉系统上位机软件的设计 13页