1 / 41
文档名称:

第四章-决策树.ppt

格式:ppt   大小:2,183KB   页数:41页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第四章-决策树.ppt

上传人:tianebandeyazi 2019/4/23 文件大小:2.13 MB

下载得到文件列表

第四章-决策树.ppt

相关文档

文档介绍

文档介绍::根节点,叶子节点,非叶子节点每个非叶子节点代表一个属性的划分每次划分的结果要么导致下一个的决策问题要么导致最终结论决策树通过从根节点开始沿着分支直到叶子节点结束来对样本进行分类决策树最终的结论(叶子节点)对应一个目标值3构建决策树的要素构建决策树的要素1、属性及属性值2、预定义的类别(目标值)3、充足的标记数据4训练集训练集对应三个要素5构建决策树的三个问题(3)什么时候停止并得到目标值?(1)从哪个属性开始或者说选择哪个属性作为根节点?(2)选择哪个属性作为后继节点?6决策树决策树算法的基本思想:选择最优属性划分当前样本集合并把这个属性作为决策树的一个节点不断重复这个过程构造后继节点直到满足下面三个条件之一停止:对于当前节点,所有样本属于同一类或者没有属性可以选择了或者没有样本可以划分了7属性选择决策树算法的一个关键问题:属性选择不同决策树算法的差异:属性选择方法不同下面以ID3算法为例讲解怎么构造决策树(ID3:InteractiveDichotomize3[RossQuinlan/1975])8ID3ID3依据信息增益来选择最优属性信息增益是通过信息熵计算而来信息熵衡量一个集合的纯度例如:集合1:10个好瓜集合2:8个好瓜和2个坏瓜集合3:5个好瓜和5个坏瓜纯度:集合1>集合2>集合39信息熵pi是当前集合里类别为i的样本所占的比例,则:Entropy({p1,…,pk})=-sum(pilog(pi))如果一个集合里的样本只有两个类别,那么:Entropy=-p1log(p1)-(1-p1)log(1-p1)当集合里的所有样本都属于同一类时,信息熵是0例如:集合1:10个好瓜当集合里所有样本均匀混合时,信息熵是1例如:集合2:5个好瓜,5个坏瓜p1=1orp1=0p1=

最近更新

做好节能改造项目 努力创建节约型机关的思考.. 3页

2025年小学六年级关于保护环境作文500字左右 4页

2025年小学元旦联欢会作文 14页

2025年小学作文暑假生活400字 6页

信息化手段在基建管理中的使用策略研究 3页

2025年小学五年级数学教案模板 53页

2025年小学五年级体育教案及反思 10页

2025年小学二年级简洁自我介绍 6页

2025年小学二年级作文有关赞美我的家乡哈尔滨.. 4页

2025年小学中秋节作文 6页

2025年小学三年级班级工作计划 35页

2025年小学三年级上册数学的教案 54页

低碳经济环境下的饭店绿色营销策略研究 3页

2025年国考笔试查分时间 3页

2025年小升初英语考试练习试卷及答案 5页

2025年小动物作文500字小猫 9页

2025年小众不俗早餐店名字 7页

优化的覆盖算法在文本挖掘中的应用研究 3页

2025年将心比心作文600字 10页

2025年对保护环境的建议书 8页

绿色食品出口政策研究-全面剖析 29页

2025年寒假里的一件事300字作文 4页

2025年寒假话题作文 5页

企业创建学习型组织的意义、理念及方法 3页

2025年国庆节手抄报文字内容一等奖 16页

2025年寒假五年级日记450字 6页

2025年寄小的读者读后感700字 8页

以机场为节点的一站式旅行服务平台研究 3页

2025年国庆节主题活动策划方案设计2025年 11页

2024年陕西工商职业学院单招职业适应性测试题.. 76页