1 / 45
文档名称:

决策树--很详细算法介绍.ppt

格式:ppt   大小:2,801KB   页数:45页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

决策树--很详细算法介绍.ppt

上传人:350678539 2019/2/13 文件大小:2.74 MB

下载得到文件列表

决策树--很详细算法介绍.ppt

文档介绍

文档介绍:*决策树(DecisionTree)**1、分类的意义数据库了解类别属性与特征预测分类模型—决策树分类模型—聚类一、分类(Classification)**数据库分类标记性别年龄婚姻否是否是FemaleMale<35≧35未婚已婚*2、分类的技术(1)决策树*(2)聚类*3、分类的程序*模型建立(ModelBuilding)模型评估(ModelEvaluation)使用模型(UseModel)*决策树分类的步骤*数据库*训练样本(trainingsamples)建立模型测试样本(testingsamples)评估模型例:*资料训练样本婚姻年龄家庭 所得否是否是未婚已婚<35≧%*4、分类算法的评估*预测的准确度:指模型正确地预测新的或先前未见过的数据的类标号的能力。训练测试法(training-and-testing)交叉验证法(cross-validation)例如,十折交叉验证。即是将数据集分成十分,轮流将其中9份做训练1份做测试,10次的结果的均值作为对算法精度的估计,一般还需要进行多次10倍交叉验证求均值,例如10次10倍交叉验证,更精确一点。***速度:指产生和使用模型的计算花费。建模的速度、预测的速度强壮性:指给定噪声数据或具有缺失值的数据,模型正确预测的能力。可诠释性:指模型的解释能力。**决策树归纳的基本算法是贪心算法,它以自顶向下递归各个击破的方式构造决策树。贪心算法:在每一步选择中都采取在当前状态下最好/优的选择。在其生成过程中,分割方法即属性选择度量是关键。通过属性选择度量,选择出最好的将样本分类的属性。根据分割方法的不同,决策树可以分为两类:基于信息论的方法(较有代表性的是ID3、)和最小GINI指标方法(常用的有CART、SLIQ及SPRINT算法等)。二、决策树(DecisionTree)

最近更新

2024年保安员证考试题库含答案(考试直接用).. 32页

2024年内蒙古乌海市行政职业能力测验题库(有.. 148页

2024年内蒙古呼和浩特市行政职业能力测验题库.. 147页

2024年内蒙古锡林郭勒盟行政职业能力测验题库.. 148页

2024年南充文化旅游职业学院单招职业适应性测.. 58页

2024年安徽国际商务职业学院单招职业适应性测.. 55页

2024年山东畜牧兽医职业学院单招职业适应性测.. 54页

2024年山西省晋中市行政职业能力测验题库往年.. 150页

2024年常州信息职业技术学院单招职业适应性测.. 54页

2024年广西机电职业技术学院单招职业适应性测.. 54页

2024年柳州铁道职业技术学院单招职业适应性测.. 54页

2024年江西外语外贸职业学院单招职业适应性测.. 54页

2024年河北省衡水市行政职业能力测验题库a4版.. 148页

2024年河南轻工职业学院单招职业适应性测试题.. 55页

2024年浙江杭州市下城区纪委招聘2人历年高频难.. 60页

2024年浙江温州市事业单位招聘13人历年高频难.. 59页

2024年浙江省宁波市鄞州区乡镇(街道)下属事业.. 60页

2024年浙江省杭州市萧山区招聘25人历年高频难.. 59页

2024年浙江衢州开化县协理员招聘12人历年高频.. 58页

2024年海南省三亚市崖州区事业单位招聘120人历.. 88页

2024年湖北省枝江市事业单位招聘150人历年高频.. 58页

语音厅小游戏策划方案 3页

游戏推广员的周报 6页

田径国家一级裁判模拟试题 61页

四年级英语下册第四单元教案 17页

丙烯酰胺与nn一亚甲基双丙烯酰胺的凝胶反应 13页

ck520立式车床总体及床身设计 37页

先天性心脏病患儿护理查房 26页

2018年某市委第三巡察组副组长填表的说明及其.. 4页

太阳能电池交直流供电电源设计太阳能电池电源.. 91页