1 / 27
文档名称:

数据挖掘十大经典算法.docx

格式:docx   大小:44KB   页数:27页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘十大经典算法.docx

上传人:gumumeiying 2021/5/28 文件大小:44 KB

下载得到文件列表

数据挖掘十大经典算法.docx

相关文档

文档介绍

文档介绍:数据挖掘十大经典算法
 一、   
,其核心算法是ID3 算法。   C4。5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:  
1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;  
2) 在树构造过程中进行剪枝;  
3) 能够完成对连续属性的离散化处理;  
4) 能够对不完整数据进行处理。  
C4。5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效.
1、机器学****中,决策树是一个预测模型;,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则 
对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。  
2、 从数据产生决策树的机器学****技术叫做决策树学****160;通俗说就是决策树.  
3、决策树学****也是数据挖掘中一个普通的方法。在这里,每个决策树都表述了一种树型结构,他由他的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠对源数据库的分割 
。当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。另外,随机森林分类器将许多决策树结合起来
 
以提升分类的正确率。 
决策树是如何工作的?   
1、决策树一般都是自上而下的来生成的.  
2、选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。 
3、从根到叶子节点都有一条路径,这条路径就是一条―规则  
4、决策树可以是二叉的,也可以是多叉的。  
对每个节点的衡量:  
1)         通过该节点的记录数  
2)         如果是叶子节点的话,分类的路径  
3)         对叶子节点正确分类的比例。  
有些规则的效果可以比其他的一些规则要好。  
由于ID3算法在实际应用中存在一些问题,,严格上说C4。5只能是ID3的一个改进算法。相信大家对ID3算法都很。熟悉了,这里就不做介绍。  
C4。5算法继承了ID3算法的优点, 并在以下几方面对ID3算法进行了改进:  
1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 
2) 在树构造过程中进行剪枝;  
3) 能够完成对连续属性的离散化处理;  
4) 能够对不完整数据进行处理。  
:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,,
C4。5只适合于 
能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。  来自搜索的其他内容:  
 ,其核心算法是ID3算法.  分类决策树算法是从大量事例中进行提取分类规则的自上而下的决策树. 决策树的各部分是:  
             根:    学****的事例集。  
             枝:    分类的判定条件.  
             叶:    分好的各个类。  
  ID3算法  
     
1)      初始化参数C={E},E包括所有的例子,为根.  
2)        IF      C中的任一元素e同属于同一个决策类则创建一个叶子      
               节点YES终止。  
           ELSE      依启发式标准,选择特征Fi={V1,V2,V3,...Vn}并创建  
                       判定节点  
   
划分C为互不相交的N个集合C1,C2,C3,...,Cn;  
3)      对任一个Ci递归.  
    2。      ID3算法  
1)      随机选择C的一个子集W    (窗口)。  
2)      调用CLS生成W的分类树DT(强调的启发式标准在后)。  
3)      顺序扫描C搜集DT的意外(即由DT无法确定的例子).  
4)      
组合W与已发现的意外,形成新的W.  
  
  
5)      重复2)到4),直到无例外为止.  
   
启发式标准:  
       只跟本身与其子树有关,采取信息理

最近更新

公共基础知识福建省南平市选调生考试(行政职.. 145页

公共基础知识辽宁省大连市选调生考试(行政职.. 149页

公共基础知识重庆市攀枝花市选调生考试(行政.. 148页

公共基础知识青海省海北藏族自治州选调生考试.. 147页

吉林省四平市事业单位招聘考试(职业能力倾向.. 148页

吉林省辽源市事业单位招聘考试(职业能力倾向.. 149页

国网2024年高校毕业生招聘江苏省电力公司招聘.. 59页

宁夏石嘴山市选调生考试(行政职业能力测验).. 147页

安徽省宣城市事业单位招聘考试(职业能力倾向.. 148页

富春环保公司战略分析 15页

安徽省阜阳市事业单位招聘考试(职业能力倾向.. 148页

山东省济宁市事业单位招聘考试(职业能力倾向.. 150页

山东省莱芜市事业单位招聘考试(职业能力倾向.. 148页

广州华夏职业学院广东华夏技工学校2024年教师.. 59页

无锡事业单位招聘今后将由“第三方”命题历年.. 60页

江苏省南通市事业单位招聘考试(职业能力倾向.. 148页

江苏省无锡市事业单位招聘考试(职业能力倾向.. 149页

河南新乡经济技术开发区2024事业单位招聘历年.. 58页

浙江省舟山市事业单位招聘考试(职业能力倾向.. 147页

湖南工程职业技术学院2024年新进人员公开招聘.. 59页

甘肃省庆阳地区选调生考试(行政职业能力测验.. 148页

福建省厦门市事业单位招聘考试(职业能力倾向.. 149页

西安雁塔区事业单位2024部分招聘历年高频难、.. 59页

贵阳市商务局2024年引进高层次人才招聘历年高.. 58页

辽宁省本溪市事业单位招聘考试(职业能力倾向.. 148页

辽宁省铁岭市事业单位招聘考试(职业能力倾向.. 148页

重庆南岸区2024年第四季度招聘事业单位人员历.. 59页

重庆黔江2024年第三季度公招事业单位专业技术.. 59页

青海省海南藏族自治州选调生考试(行政职业能.. 147页

黑龙江省双鸭山市事业单位招聘考试(职业能力.. 147页