1 / 6
文档名称:

数据仓库与数据挖掘-实验三 决策树算法实验报告范文5.doc

格式:doc   大小:27KB   页数:6页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘-实验三 决策树算法实验报告范文5.doc

上传人:Q+1243595614 2018/6/10 文件大小:27 KB

下载得到文件列表

数据仓库与数据挖掘-实验三 决策树算法实验报告范文5.doc

文档介绍

文档介绍:20123100144 邱佳鹏实验三__决策树实验
实验三决策树算法实验
一、实验目的: 熟悉和掌握决策树的分类原理、实质和过程;掌握典型的学****算法和实现技术。
二、实验原理: 决策树学****和分类.
三、实验条件:
四、实验内容:
1 根据现实生活中的原型自己创建一个简单的决策树。
2 要求用这个决策树能解决实际分类决策问题。
五、实验步骤:
1、验证性实验:
(1)算法伪代码
算法Decision_Tree(data,AttributeName) 输入由离散值属性描述的训练样本集data; 候选属性集合AttributeName。
输出一棵决策树。(1) 创建节点N;
(2) If samples 都在同一类C中then (3) 返回N作为叶节点,以类C标记; (4) If attribute_list为空then
(5) 返回N作为叶节点,以samples 中最普遍的类标记;//多数表决(6) 选择attribute_list 中具有最高信息增益的属性test_attribute; (7) 以test_attribute 标记节点N;
(8) For each test_attribute 的已知值v //划分 samples ;
(9) 由节点N分出一个对应test_attribute=v的分支;
(10令Sv为 samples中 test_attribute=v 的样本集合;//一个划分块(11)If Sv为空 then
(12)加上一个叶节点,以samples中最普遍的类标记;
(13)Else 加入一个由Decision_Tree(Sv,attribute_list-test_attribute)返回节点值。
(2)实验数据预处理 
Age:30岁以下标记为“1”;30岁以上50岁以下标记为“2”;50岁以上标记为“3”。 Sex:FEMAL----“1”;MALE----“2” 
Region:INNER CITY----“1”;TOWN----“2”; RURAL----“3”; SUBURBAN----“4” e:5000~2万----“1”;2万~4万----“2”;4万以上----“3” Married Children Car 
Mortgage 
Pep:以上五个条件,若为“是”标记为“1”,若为“否”标记为“2”。
Age sex region e married children car mortgage pep
1 2 1 1 2 1 1 2 2
1 2 1 1 2 2 2 2 1
2 1 4 1 2 1 2 2 1
2 1 1 1 1 2 2 2 2
1 2 1 1 1 2 2 2 2
1 2 1 1 2 1 2 1 1
2 1 2 1 1 2 1 1 2
2 1 1 1 2 1 1 2 1
2 1 3 1 2 2 1 2 1
2 1 2 2 2 1 2 2 2
2 2 1 2 2 2 2 1 1
2 1 2 2 1 1 2 1 1
2 2 1 2 1 2 2 1 2
1 1 1 2 1 2 2 2 1
3 2 1 2 1 1 1 2 2
1 1 1 2 1 1 1 2 1
1 1 3 2 2