1 / 4
文档名称:

决策树算法及其应用.doc

格式:doc   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

决策树算法及其应用.doc

上传人:ktdmzug142 2015/8/22 文件大小:0 KB

下载得到文件列表

决策树算法及其应用.doc

相关文档

文档介绍

文档介绍:决策树算法及其应用
摘要决策树算法是数据挖掘中的一种算法,本论文从决策树生产过程,优点,评价指标及具体应用中阐述决策树算法,为决策树算法在具体实例中应用提供可能。
【关键词】决策树算法应用优点
决策树是在信息论基础上建立的,对数据进行分类的一种常用方法。决策树是一种树型结构,执行过程与流程图比较相类似,在决策树中的各个结点以及分枝分别代表着一种测试,属性上的一个测试就用结点进行表示,输出一个测试则用分枝进行表示,树中的叶结点代表类或类分布。首先,一棵决策树的创建是通过训练数据建立的,训练数据是根据一批已知的数据得到的。其次,决策树建成后,要进行数据预测。决策树创建整个过程,我们可以视为是数据规则的生成过程,因此,决策树成功实现数据规则的可视化,输出结果易于理解,效率也比较高,所以比较常用。
1 决策树生产过程
决策树进行传统的数据分类包含两个步骤:
第一步:利用训练集进行创建模型阶段,找到映射函数表示模型,从指定的训练集中获取知识,这是一个学****的过程。
第二步:利用生成的决策树预测数据的类别,使用上一步训练完成的函数模型进行预测,对输入的记录,从根结点开始一直到叶结点进行测试属性值,然后对数据集中的每一类数据进行描述,生成分类规则。
具体工作过程如图1所示。
2 决策树算法的优点
(1)学****该算法,不要求使用者的知识背景丰厚,就能够在训练事例中用属性→结论的方式来进行表达。
(2)训练集数据量较大的情况下,决策树模型效率较高。
(3)决策树是一种树状结构,它是最简单直观的,因此在分类模型中经常被应用的方法之一,通过从根结点一直到达叶子结点的路径转换,最终能够生成分类规则以IF→THEN形式进行表示,这样更能够让人容易理解。
(4)决策树方法对于分类而言,精确度较高。
3 决策树的评价指标
(1)准确的预测性。决策人员最关心的就是预测的准确性,分类模型具有对未知新数据进行准确预测的能力、也能对未知的数据类的预测能力。
(2)。
(3)计算复杂性。在数据挖掘的过程中,操作的数据对象是海量信息的数据库,所以空间和时间的复杂性将直接影响模型的计算成本,计算的复杂度是在海量数据库中具体实现的细节决定的。
(4)处理规模性。
(5)模型强健性。
4 决策树算法在学生就业工作中应用
设计方案

选取计算机系10届、11届、12届计算机科学与技术专业学生为研究对象,学生人数为200人。
数据采集
(1)学生基本信息库。数据结构如下:姓名、学号、性别、班级、籍贯。
(2)学生就业信息库。内容包括学号、姓名、参加公司培训、是否优质就业(工资在3000元以上为优质就业)等。
(3)成绩表。成绩数据库中包括了学生的课程总成绩平均分和综合测评成绩平均分,这个数据库由教师在教学过程中和辅导员对学生表现评定产生。
数据项处理
数据集成。根据给出的数据文件,将三个数据源的数据利用数据库技术生成学生就业分析表