1 / 7
文档名称:

决策树相关算法研究.doc

格式:doc   大小:32KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

决策树相关算法研究.doc

上传人:ohghkyj834 2019/5/13 文件大小:32 KB

下载得到文件列表

决策树相关算法研究.doc

相关文档

文档介绍

文档介绍:决策树相关算法研究摘要:,、算法描述和分裂属性选取等方面进行比较,为其他研究者提供参考。关键词:分类;ID3; 中图分类号:TP312文献标识码:A文章编号:1009-3044(2011)15-3572-03 AnAssociationExploreBasedonDecisionTreeAlgorithm WANGHui,HOUChuan-yu (SchoolofInformationEngineering,SuzhouUniversity,Suzhou234000,China) Abstract:,forexample,datastructureofdecisiontree,,andthechoiceofdivisionattributeandsoon,inordertoprovidethisforothers. Keywords:categories;ID3; 随着计算机的普及和网络的高速发展,人们获得信息的途径越来越多,同时获取信息的量呈几何级数的方式增长。如何从海量信息获得有用知识用于决策,成为大家关注的问题。数据挖掘也就是从大量信息中挖掘出有用知识的过程。数据挖掘上的常用的分类方法有决策树方法,贝叶斯方法,神经网络方法,粗糙集方法,遗传方法等。。 ID3算法是Quinlan于1993年提出的[1-2],它使用信息增益来选择分裂属性。ID3算法的根本问题是怎样选取树的每个节点的分裂属性。ID3算法[4]用“信息增益”去衡量给定的属性区分训练样例的能力。它在增长树的每一步都是使用信息增益标准从候选属性中选择属性。[5]是ID3算法的改进,它使用信息增益率来进行分裂属性的选择。 1),根据类别属性的值被分成互相独立的类c1,c2,…,ck,则识别T的一个元素所属哪个类所需要的信息量为,其中p为c1,c2,…,ck的概率分布,即。,T2……Tn则确定T中的一个元素类的信息量可以通过确定Ti的加权平均值来得到,即Info(Ti)的加权平均值为:Info(X,T)=。,其中一个信息量是需要确定的T的一个元素的信息量,另一个信息量是在已得到的属性X的值后需确定的T一个元素的信息量,信息增益度的公式为: Gain(X,T)=Info(T)-Info(X,T)。 2) ,步骤1、2、3同ID3。。,得到信息增益率。 .