1 / 20
文档名称:

See5使用说明.ppt

格式:ppt   页数:20页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

See5使用说明.ppt

上传人:bjy0415 2015/9/19 文件大小:0 KB

下载得到文件列表

See5使用说明.ppt

相关文档

文档介绍

文档介绍:——小暖
See5使用说明
安装成功后,See5-demo\Samples提供了几组数据可供使用:
.data:训练使用数据
.names:训练数据的说明文档
.test:评价使用数据
以Samples中的实验为例, , , 。
文档介绍
,主要有用信息为实例个数,属性个数,属性信息说明和待分类别说明。
‘-’在data文件中表示为’N/A’

此文档中保存了即将用于分类的数据,。
在试用版中,能够处理的实例个数不超过400条。
按照names文档中的说明,每条实例应该有38条属性。但是真实情况是多出了一条。这条被认为是该实例的真实类别,但不用于分类,只用于评价。
,用于精度评价的文档。

界面介绍
数据导入;
构建分类器;
停止分类;
查看输出结果;
使用分类器;
相互参照;
相关文档
(蓝色表示存在,灰色表示不存在)
,点击按钮,弹出有图所示对话框。对话框中的默认选项足以满足分类要求。可勾选处将在后续讲解。点击OK,生成分类树。
根据勾选不同选项,得到的output文件内容会有所改变。将在后续讲解。
使用流程
随机弹出如下窗口,并产生了新的两个文件:
使用流程
至此,基本分类已经完成。
Decision tree

被分到该类的样本数

叶子的层数
错误率=1/400

1. (n , lift x)
n:根据规则分到该类别的
训练样本数;
m:被错分的训练样本数。
2. 分类的可信度
对于一个实例来说,可能有多条规则都对其适用。在这种情况下,SEE5采用了一种投票的方式。在所有使用规则中投票,以可信度作为权重。计算综合后,以投票最高的类为准。
通常规则数会小于叶子层数,本例数为7和13。
rulesets
1
2