1 / 3
文档名称:

Clementine决策树C50算法.docx

格式:docx   大小:59KB   页数:3页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Clementine决策树C50算法.docx

上传人:dlmus1 2022/6/3 文件大小:59 KB

下载得到文件列表

Clementine决策树C50算法.docx

相关文档

文档介绍

文档介绍:: .

输出类型:指定分析输出的内容。指定希望最终生成的模型是决策树还是规则集: .

输出类型:指定分析输出的内容。指定希望最终生成的模型是决策树还是规则集。
组符号:如果选择该选项,(采用ChiMerge分箱法检查当前分组变量个各个类别能否合并,如果可以应先合并后再分支)。如果没有选择该选项,。
使用推进:提高其精确率。这种方法按序列建立多重模型。第一个模型以通常的方式建立。随后,建立第二个模型,聚焦于被第一个模型错误分类的记录。以此类推,最后应用整个模型集对样本进行分类,使用加权投票过程把分散的预测合并成综合预测。试验次数选项允许控制用于助推的模型数量。
交互验证:如果选择了该选项,,来估计基于全部数据建立的模型的精确度。如果数据集过小,不能拆分成传统意义上的训练集和测试集,这将非常有用。或用于交叉验证的模型数目。
模式:对于简单的训练,。高级训练模式选项允许对训练参数更多的直接控制。
简单模式:
偏好(支持):选择“准确性”,某些情况下,会导致过度拟合。选择“普遍性”以使用不易受该问题影响的算法设置。
预期噪声(%):指定训练集中的噪声或错误数据期望比率专家模式:
模式Q简单®专家修剪严重也无二每个子分戋的最小记录教」2:
因使用全局修即□辨别属性
字段|4褪|成本|分析|注矿~|程一|[•执行]|取消j修剪纯度:决定生成决策树或规则集被修剪的程度。提高纯度值将获得更小,更简洁的决策树。降低纯度值将获得更加精确的决策树。
子分支最小记录数:子群大小可以用于限制决策树任一分支的拆分数。
全局修剪:第一阶段:局部修剪;第二阶段:全局修剪。
辨别属性:如果选择了该选项,。被发现与分析无关的预测字段将不参与建模过程。这一选项对许多预测字段元的模型非常有用,并且有助于避免过度拟合。
”成本”选项见“CHAID"成本”选项----误判成本值,