1 / 20
文档名称:

新决策树例子.docx

格式:docx   大小:429KB   页数:20页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

新决策树例子.docx

上传人:yixingmaoh 2019/9/3 文件大小:429 KB

下载得到文件列表

新决策树例子.docx

相关文档

文档介绍

文档介绍:新决策树例子rpart包的rpart函数Iris数据集library(rpart)#加载rpart包head(iris)#看看iris数据集里有哪些变量iris以鸢尾花的特征作为数据来源,数据集包含150个数据,分为3类,每类50个数据,每个数据包含4个属性分别是花萼长度、花萼宽带、花瓣长度、=rpart(Species~.,data=iris,method="class",parms=list(split="gini"))#rpart(formula,data,method,parms,...)得到决策树对象,其中(1)formula是回归方程的形式,y~x1+x2+…,iris一共有5个变量,因变量是Species,自变量是其余四个变量,所以formula可以省略为Species~.data是所要学****的数据集(3)method根据因变量的数据类型有如下几种选择:anova(连续型),poisson(计数型),class(离散型),exp(生存型),因为我们的因变量是花的种类,属于离散型,所以method选择class(4)parms可以设置纯度的度量方法,有gini(默认)和information(信息增益)两种。plot(,uniform=T,branch=0,margin=,main="ClassificationTree\nIrisSpeciesbyPetalandSepalLength")#plot的对象是由rpart得到的决策树对象,可以把这课决策树画出来,其中uniform可取T,F两个值,T表示图形在空间上均匀分配branch刻画分支的形状,取值在0和1之间,branch=0是倒v型,branch=1是直角型,而当branch属于(0,1)时是梯形(3)margin刻画图的大小,margin越大,决策树越小,上述三幅图的margin=,而当margin=1时,决策树变小了(4)main是图的标题,其中“\n”是换行的意思text(,=T,fancy=T,col="blue")text(,=T,fancy=F,col="blue")=T,在每个节点处都会显示落在该节点的观测个数和对应的分类,=F时就不显示观测个数了。fancy=T、F的区别见上图col=“blue”就是写在树上的信息的颜色。还有另一种画图函数library()(,branch=0,=2,type=1,extra=1,="gray",="green",="blue",="red",main="决策树")(,branch=0,=0,type=1,extra=1,="gray",="green",="blue",="red",main="决策树"),=0时画出来的分支跟plot里的一样,就是一条线,=2时,分支的宽度是数据的标准差,=1时,是方差type:type=0只对叶子节点画圆圈。type=1对根节点和叶子节点画圆圈,分裂属性的值会写在节点框的上面。type=2时跟type=1近似,但分裂属性的值会写在节点框的下面。type=3时每个根节点左右分支对应的属性的取值范围都标出来了(之前那些都只标了左分支的属性取值),并且只对叶子节点画圆圈。type=4时,跟type=3近似,但对叶子节点和根节点都画圆圈。extra是表示在节点处显示的额外信息的种类。当extra=0(缺省值)时,无额外信息。当extra=1,在节点处会显示落在该节点的观测个数和对应的分类(如上图)。当extra=2,在节点处会显示(在该点分类正确的个数/落在该节点的观测个数)。="gray",="green",="blue",="red"分别是决策树中节点框的阴影颜色、填充颜色、边框颜色、=rpart(Species~.,data=iris,method="class",parms=list(split="information"))plot(,uniform=T,branch=0,margin=,main="Clas