1 / 15
文档名称:

数据仓库与数据挖掘-实验三 决策树算法实验报告范文2.doc

格式:doc   大小:80KB   页数:15页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘-实验三 决策树算法实验报告范文2.doc

上传人:Q+1243595614 2018/6/10 文件大小:80 KB

下载得到文件列表

数据仓库与数据挖掘-实验三 决策树算法实验报告范文2.doc

相关文档

文档介绍

文档介绍:通信7班张耿旭 20123100031
实验三决策树算法实验
实验目的
熟悉和掌握决策树的分类原理、实质和过程;掌握典型的学****算法和实现技术。
二、实验原理
决策树学****和分类.
三、实验条件
四、实验内容
1根据现实生活中的原型自己创建一个简单的决策树。
2要求用这个决策树能解决实际分类决策问题。
五、实验步骤
1、验证性实验:
(1)算法伪代码
算法Decision_Tree(data,AttributeName) 输入由离散值属性描述的训练样本集data; 候选属性集合AttributeName。
输出一棵决策树。
(1) 创建节点N;
(2) If samples 都在同一类C中then
(3) 返回N作为叶节点,以类C标记;
(4) If attribute_list为空then
(5) 返回N作为叶节点,以samples 中最普遍的类标记;//多数表决
(6) 选择attribute_list 中具有最高信息增益的属性test_attribute;
(7) 以test_attribute 标记节点N;
(8) For each test_attribute 的已知值v //划分 samples ;
(9) 由节点N分出一个对应test_attribute=v的分支;
(10令Sv为 samples中 test_attribute=v 的样本集合;//一个划分块
(11)If Sv为空 then
(12)加上一个叶节点,以samples中最普遍的类标记;
(13)Else 加入一个由Decision_Tree(Sv,attribute_list-test_attribute)返回节点值。
(2)实验数据预处理 
Age:30岁以下标记为“1”;30岁以上50岁以下标记为“2”;50岁以上标记为“3”。
 Sex:FEMAL----“1”;MALE----“2” 
Region:INNER CITY----“1”;TOWN----“2”; RURAL----“3”; SUBURBAN----“4”
 e:5000~2万----“1”;2万~4万----“2”;4万以上----“3”
 Married Children Car Mortgage 
Pep:以上五个条件,若为“是”标记为“1”,若为“否”标记为“2”。
Age sex region e married children car mortgage pep
1 2 1 1 2 1 1 2 2
1 2 1 1 2 2 2 2 1
2 1 4 1 2 1 2 2 1
2 1 1 1 1 2 2 2 2
1 2 1 1 1 2 2 2 2
1 2 1 1 2 1 2 1 1
2 1 2 1 1 2 1 1 2
2 1 1 1 2 1 1 2 1
2 1 3 1 2 2 1 2 1
2 1 2 2 2 1 2 2 2
2 2 1 2 2 2 2 1 1
2 1 2 2 1 1 2 1 1
2 2 1 2 1 2 2 1 2
1 1 1 2 1 2 2 2 1
3 2 1 2 1 1 1 2 2
1 1 1 2 1 1 1 2 1
1 1 3 2 2 2 1 2 1
3 1 2 2 1 2 2 2 1
3 2 3 3 1 1 1 2 1
3 2 2 3 1 2 1 1 2
3 1 3 3 1 1 2 2 1
3 2 1 3 1 2 1 2 2
3 2 1 3 1 1 1 1 1
3 1 1 3 1 2 1 1 2
3 1 3 3 1 2 2 2 2
3 2 4 3 1 2 2 1 1
3 1 3 3 2 2 1 1 2
(3)Matlab语句:
[Tree RulesMatrix]= DecisionTree(DataSet, AttributName);
2、设计性实验:
(1).进入创建新图工作窗。
(2).设置决策树分类算法和相应地环境参数。
(3) 输入训练数据集。
(4) 训练决策树以得出能够对新输入数据正确分类的模型。
(5) 观察实际分类效果,记录,修改、调试再实验,直到满意。
六、实验结论


先建立训练库,其程序如下:
function [Tree RulesMatrix]=DecisionTree(DataSet, AttributName)
if nargin<1
error('????????????');
else
if isstr(DataSet)
[DataSet AttributValue