1 / 63
文档名称:

一种改进的决策树算法研究与应用.pdf

格式:pdf   大小:1,076KB   页数:63页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种改进的决策树算法研究与应用.pdf

上传人:陈潇睡不醒 2021/10/31 文件大小:1.05 MB

下载得到文件列表

一种改进的决策树算法研究与应用.pdf

相关文档

文档介绍

文档介绍:致 谢
在我的硕士论文完成之际,回首攻读硕士研究生期间的学****和生活,感觉
自己受益良多,自己的能力有很大的提高,这三年的时间,受到了许多人的帮
助,在此像他们表示由衷的感谢。
首先,我要衷心感谢我的导师邢长征教授,在整个学****过程中,提供给我
许许多多能终身受益的锻炼的机会。整个的攻读过程,每一个环节都倾注了老
师的汗水和心血。同时老师严谨的作风、优异的领导才能、远见的卓识令人钦
佩,相信,从老师身上学到的这一切,将在我日后的学****生活工作中发挥巨大
的作用。
其次,感谢电信学院所有曾经辛勤培养、关心、支持我的老师们,尤其要
感谢关欣老师,是他们在学****和生活上给了我很大的帮助。
感谢同门的师兄弟姐妹们一直给予我的鼓励与支持,感谢那些素不相识文
献工作者,是他们的不倦的工作奠定了我论文的基础。
感谢我的同学、朋友们一直以来对我的照顾和支持。
感谢我的家人,是他们长期以来在生活和精神上给我巨大的支持,他们的
支持一直是我前进的动力。
最后再一次向所有的关心、爱护和帮助我的人们致以最衷心的感谢。
摘 要
决策树算法在数据挖掘技术中有重要的作用,本文着重研究了决策树理论中的
算法,针对其在当训练集样本包含大量的连续值属性时,算法将会效率低
下的缺点,提出了利用划分熵取得最小值的改进方法,得出对连续值属性离散
化处理时,只需对其其边界点进行计算,降低连续值属性离散化的时间复杂度。
同时对求解信息增益率的公式进行了简化。本文改进了一种决策树的简化模
型。使之能利用信息增益度量选择测试属性,得到最为合理的测试属性,也使得
属性选择度量的信息理论含义清晰,可解释性明确。本文设计实现了一个学生成
绩预测系统,以 C 语言典型课程为例,挖掘该课程成绩与哪些因素相关,哪些
是决定性因素,使教师针对不同类型的学生采用不同的教学方法和教学侧重
点,提高该课程成绩。
关键词:决策树;;离散化



- I -
Abstract
Decision tree algorithm plays an important role in data studies an
important algorithm named in this paper, For the samples in the training set
contains a large number of continuous-valued attribute,algorithm will be
proposed an improved method of obtaining the minimum entropy,derived for
continuous-valued attribute discretization the best demarcation point is
at the border It can reduce the continuous-calued attributes and the time
complexity of the same time,it comprises information gain
complex decision tree does not understand and build for the
paper presents a simplified model of the decision that it can
use information gain measure of selection test can get to be the most
reaonable test paper implements a student performanace forecasting
system based on typical excavates the factors and the decisive factor