文档介绍:第9章决策树算法1第9章决策树算法本章大纲::使用者不需要了解很多背景知识,只要训练事例能用属性→结论的方式表达出来,就能用该算法学习;决策树模型效率高,对训练集数据量较大的情况较为适合;分类模型是树状结构,简单直观,可将到达每个叶结点的路径转换为if→then形式的规则,易于理解;决策树方法具有较高的分类精确度。:模型训练阶段:根据给定的训练集,找到合适的映射函数H:→C的表示模型。使用上一步训练完成的函数模型预测数据的类别,或利用该函数模型,对数据集中的每一类数据进行描述,形成分类规则。:,其中每个实例,称为例子,训练数据集中包含以下属性A。同时给定类别集合C。对于训练数据集D,决策树是指具有以下性质的树:每个内部节点都被标记一个属性Ai。每个弧都被标记一个值,这个值对应于相应父结点的属性。每个叶节点都被标记一个类Cj。,它告诉我们在节点N上测试哪个属性合适,如何选择测试与测试的方法,从节点N上应该生长出哪些分支。。XiA=,那么分裂准则的形式为Xi,其中,就称为节点n的分裂点。,那么的形式为,其中,就称为节点n的分裂子集。注意:分裂准则与分裂属性、分裂点、分裂子集并不等同,它们是四个不同的概念,-1,图9-2,图9-3所示,图中设X为分裂属性,是属性X的已知值。图9--3按照分裂子集划分而成的决策树图与相关的两个具体例子图10第9章决策树算法