文档介绍:通信7班张耿旭 20123100031
实验三决策树算法实验
实验目的
熟悉和掌握决策树的分类原理、实质和过程;掌握典型的学****算法和实现技术。
二、实验原理
决策树学****和分类.
三、实验条件
四、实验内容
1根据现实生活中的原型自己创建一个简单的决策树。
2要求用这个决策树能解决实际分类决策问题。
五、实验步骤
1、验证性实验:
(1)算法伪代码
算法Decision_Tree(data,AttributeName) 输入由离散值属性描述的训练样本集data; 候选属性集合AttributeName。
输出一棵决策树。
(1) 创建节点N;
(2) If samples 都在同一类C中then
(3) 返回N作为叶节点,以类C标记;
(4) If attribute_list为空then
(5) 返回N作为叶节点,以samples 中最普遍的类标记;//多数表决
(6) 选择attribute_list 中具有最高信息增益的属性test_attribute;
(7) 以test_attribute 标记节点N;
(8) For each test_attribute 的已知值v //划分 samples ;
(9) 由节点N分出一个对应test_attribute=v的分支;
(10令Sv为 samples中 test_attribute=v 的样本集合;//一个划分块
(11)If Sv为空 then
(12)加上一个叶节点,以samples中最普遍的类标记;
(13)Else 加入一个由Decision_Tree(Sv,attribute_list-test_attribute)返回节点值。
(2)实验数据预处理 
Age:30岁以下标记为“1”;30岁以上50岁以下标记为“2”;50岁以上标记为“3”。
 Sex:FEMAL----“1”;MALE----“2” 
Region:INNER CITY----“1”;TOWN----“2”; RURAL----“3”; SUBURBAN----“4”
 e:5000~2万----“1”;2万~4万----“2”;4万以上----“3”
 Married Children Car Mortgage 
Pep:以上五个条件,若为“是”标记为“1”,若为“否”标记为“2”。
Age sex region e married children car mortgage pep
1 2 1 1 2 1 1 2 2
1 2 1 1 2 2 2 2 1
2 1 4 1 2 1 2 2 1
2 1 1 1 1 2 2 2 2
1 2 1 1 1 2 2 2 2
1 2 1 1 2 1 2 1 1
2 1 2 1 1 2 1 1 2
2 1 1 1 2 1 1 2 1
2 1 3 1 2 2 1 2 1
2 1 2 2 2 1 2 2 2
2 2 1 2 2 2 2 1 1
2 1 2 2 1 1 2 1 1
2 2 1 2 1 2 2 1 2
1 1 1 2 1 2 2 2 1
3 2 1 2 1 1 1 2 2
1 1 1 2 1 1 1 2 1
1 1 3 2 2 2 1 2 1
3 1 2 2 1 2 2 2 1
3 2 3 3 1 1 1 2 1
3 2 2 3 1 2 1 1 2
3 1 3 3 1 1 2 2 1
3 2 1 3 1 2 1 2 2
3 2 1 3 1 1 1 1 1
3 1 1 3 1 2 1 1 2
3 1 3 3 1 2 2 2 2
3 2 4 3 1 2 2 1 1
3 1 3 3 2 2 1 1 2
(3)Matlab语句:
[Tree RulesMatrix]= DecisionTree(DataSet, AttributName);
2、设计性实验:
(1).进入创建新图工作窗。
(2).设置决策树分类算法和相应地环境参数。
(3) 输入训练数据集。
(4) 训练决策树以得出能够对新输入数据正确分类的模型。
(5) 观察实际分类效果,记录,修改、调试再实验,直到满意。
六、实验结论
先建立训练库,其程序如下:
function [Tree RulesMatrix]=DecisionTree(DataSet, AttributName)
if nargin<1
error('????????????');
else
if isstr(DataSet)
[DataSet AttributValue