1 / 7
文档名称:

基于分类的机器学习方法中的决策树算法探讨.doc

格式:doc   大小:62KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于分类的机器学习方法中的决策树算法探讨.doc

上传人:小博士 2018/9/27 文件大小:62 KB

下载得到文件列表

基于分类的机器学习方法中的决策树算法探讨.doc

相关文档

文档介绍

文档介绍:基于分类的机器学****方法中的决策树算法探讨
[ ]自21世纪我国信息化时代的发展以来, 数据库中的数据也在随着时代的发展不断增加,目前人们对数据的分析能力早已达不到时代发展的要求。数据库目前所拥有的功能只够作为数据的快速储存和搜索,并不能计算出数据与数据之间的差距,也不能通过现有的数据推算出发展的方向。其只是单纯的具备丰富完整的数据,但所包含的信息量太少。因此, 为了改进这一情况,需要相关技术人员研发出能够将所有数据分析转化成有利用价值信息的工具,其代表着数据挖掘技术的产生。数据挖掘是一个可以将数据转化成有用信息,并将信息进行归纳总结的数据整理工具,这一措施的出现,极大程度上促进了企业的发展。因此,笔者就分类的机器学****方法中的决策树算法进行论述。
[关键词]机器学****方法决策树算法分类 TM86 A
1009-914X (2017) 10-0283-01
分类的定义
数据挖掘中的分类就是指对一系列相关数据加以
汇总分类的数据集,合集中的数据都是根据它们的不同属性来决定的,在合集之中只有一种属性是个例的。利用相应的模型表达合集,根据属性不同而变换的量的数据库便称之为合集,合集中的数据包含连续属性、离散属性,通过一个字符表示这种类别的属性,再用一个字母表示合集中数据的数量,从而推算出计算模型,以便数据的挖掘。
2、 分类的目的
通过对数据库中大量的数据进行数据整合分析, 并根据每项数据不同的概念进行分类,其分类的目的是利用某种例如模型的方法,将隐藏在数据中的函数经过数据整理分析而推算出来,目前被运用较多的地方是商业发展方面。根据输入数据的特性,进行细致分析,利用一种适合的模型进行描述,将这些分析过的数据进行整理归纳后放入特定的数据库中,这些数据有助于未来新数据类型的预测,也可以通过这些数据推测出将来的发展趋势。预测的用意就是通过数据库中已获得的数据推算出所需的未知数据,但这类数据只可算作预测数据,并不是确定的数据,也可能会因为意外而产生改变。
3、 分类器的构造方法

统计方法包括准确数据的整理和推测数据的整理, 利用判别函数和原型事例进行数据分析的方法。

机器学****的方法是一种利用决策树和归纳的方式进行数据分析的方法,先由决策树分析得出数据,再进行数据的归纳总结。其中决策树是目前被使用较多的一种计算方式,方便对数据进行深入研宄。

神经网络方法主要使用的是误差反向传播的计算方式,即是一种利用非线性判别函数分析数据的方法。通过逆向反应的方法分析数据,再由点和边组成新的结构体系,从而推导出函数模型,以达到数据整理分析的目的。

粗糙集方法是最新产生的一种挖掘数据的方法, 通过规则性的方式归纳计算数据,以达到数据分析的目的。
4、决策树算法
在分类器算法中决策树具有如下特征:有向以及无环,这也就暗示了其在分类、预测等领域的广泛应用,研究决策树算法不仅仅有助于数据分析以及挖掘, 对于人工智能的发展也有这不可言喻的作用。简单来
说,句册书的每个内部节点都为属性的集合,节点所具备的属性也被成为测试属性,利用决策树进行分类首先需要具备决策树模型,而决策树模型的构建则需要通过以下两个环节。第一个环节为决策树的构建, 在建立过程中需要基于广度优先递归算法而展开,最终建