文档介绍:完整word版,决策树分类算法
完整word版,决策树分类算法
1 / 71
完整word版,决策树分类算法
决策树分类算法
决策树是一种用来表示人们为了做出某个决策而
进行的一系列判断过程的树形图。决策树方法的根本
ure
〔温度〕
:cool
完整word版,决策树分类算法
完整word版,决策树分类算法
7 / 77
完整word版,决策树分类算法
Humidity
〔湿度〕
:normal
完整word版,决策树分类算法
完整word版,决策树分类算法
7 / 77
完整word版,决策树分类算法
Windy
〔风〕
:false
完整word版,决策树分类算法
完整word版,决策树分类算法
7 / 77
完整word版,决策树分类算法
那么,它属于哪种类型的气候呢?
解: 下面介绍用 ID3算法如何从表 1所给的训练集中
完整word版,决策树分类算法
完整word版,决策树分类算法
7 / 77
完整word版,决策树分类算法
构造出一棵能对训练集进行正确分类的判定树。
表1
气候训练集
No.
Attributes
Class
Outlook
Temperature
Humidity
Windy
1
Sunny
Hot
High
False
N
2
Sunny
Hot
High
True
N
3
Overcast
Hot
High
False
P
4
Rain
Mild
High
False
P
5
Rain
Cool
Normal
False
P
6
Rain
Cool
Normal
True
N
7
Overcast
Cool
Normal
True
P
8
Sunny
Mild
High
False
N
9
Sunny
Cool
Normal
False
P
10
Rain
Mild
Normal
False
P
11
Sunny
Mild
Normal
True
P
12
Overcast
Mild
High
True
P
13
Overcast
Hot
Normal
False
P
14
Rain
Mild
High
True
N
在表1所示的训练集中,总共有 14个对象,其中 9个
正例(P类),5个反例(N类)。分类要求的信息是I(p,
完整word版,决策树分类算法
完整word版,决策树分类算法
14 / 714
完整word版,决策树分类算法
下面分别计算四个属性 A1=outlook,A2=temperature,A3
humidity,A4=windy的信息增益,选择信息增益最大的属性作为判定树的树根。
A1=outlook的取值为{sunny,overcast,rain}。训练集
C中14