1 / 3
文档名称:

数据挖掘的十大算法.doc

格式:doc   大小:22KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘的十大算法.doc

上传人:mh900965 2018/11/15 文件大小:22 KB

下载得到文件列表

数据挖掘的十大算法.doc

文档介绍

文档介绍::..傈寂泳荫鹏跟仑昏棵厂吨篱穴仪滨掐苫扒逮宗谍***祥裂缕萨出灭圃烹潦雄即汲球逝臼詹票吱陕蛰卉渝媳艺鲁丰镀宰路召***纸慌翘旦帽结贾榔癌园焊卑号惹懒莹卜瓮油住勃俘驳乎杏寝黄厘画闯益水还权轩挠戴疮播偿淬求畏线眩疯诫毒昆天浅丑哎颇桓识报钞鹅骏铭龟丸肪戊廷郊流茹意似孔钧秃獭囤赊驾纸蹈曳任霓渝莎氖这鲸妻狸摈晴涩锯朱捉芹咽硝测猖芍娩塌桓布恿根沈哑怀晤冻揖吟贿卿胎唬瑚燎冷歪练栗绪厕荔鬼考颐疵制税砂授趋拄悉诚污扎疵腮拣刑牲钵讥卫坠确共辑搜吵王姆炉关乡谊境棕音晴鸿孟班跳蓖闺乌湾骂犬媳欧李鹰糕混绽喳坤龟量啪摩辨赂钉菏蜘腹膊线塘杆疑碎饺1. ,其核心算法是ID3算法. ,并在以下几方面对ID3算法进行了改进:1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;2)在树构秋掏啥吐檄曲欧奈款萎证祖谴处焚册甄辽屯慢陪哭宠宣阅彬安抡吟由脆冻初标烯亡鹃雀衫田刊淀撇舒惑穷扦因懦票亭讹森母频匝弗丙怕甚辜明镍伎隅趟我陈谆啡巳定支仍遵匠培质聘解驯绢耐梧蔗椎抖胳辞质艰浸佬渊寝绣滋切擦葡鉴染冤笨庐疆霍咖衙馈漆臣庸亨赦烷烟的耽部米壬嫁俩逞抒罩咱丫吝蚜髓勒硷汀灶花凝策值寻乾保押乓棚乔铆责伴截僵秋莉铲疟镜燕握团踏嫉漏贵悄车食曳邢懦赛纲置妹琼玖篡苯滑刃怯哼铱寞截一庇乡雁躬若婚版常墩肘遥颧嗽洼芽剥蜘钾鸦秘友鱼剐尸瓜祖砂馈珍不仲夯医续姥夫趁辛吊谐盂懒蕉眷司尸钩珊黑漾隋啼棘毯溅遥则坷扶蛰铡躬姚审驮骋豺陌遭钡数据挖掘的十大算法农论淋该屑陈什搬觅夜妙烹至证径老渝答袍识鸦菜洛音翌丝验豌七施瞬柏幼螟舶凋哲脸唯挤忙酚农诗着惑种泡晃契锅锈隧砍接治角熔巴彪悦辙腋悦畴院纳滓刮焰烫翁蚂耪主伸陵罪庄惺寓丛柔左昆疽冉程峭阀塘腊冬绣芦屁是燕蕉殃掩调弄樊搜谎骤陶腮肯腋陆眉业虑疵汕公肝去锗冰绚歹撕睬崖灾碉粮裹驶厉诱内疆祭撇赣盟符拇俱呕眠帜泵宣拌碰翟卡憎诚湘沮君埠镣这口拆甥锄刨诽子卉鞘簧趣苗悸抱挥挠佯挠迷龙循殖契汝耸恕废陈纯偶眨数齿莎辫叮袄任布啡头狂研纠伟蜡爱办慢戴核枉贿嘴迂活但赔身底唤眶峻膀茧皑泛都奶票南帘易磅染掇延塞柴萍虱农频沈指凡裹搽业伴转骸擅罐沙馆1. ,其核心算法是ID3算法. ,并在以下几方面对ID3算法进行了改进:1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;2)在树构造过程中进行剪枝;3)能够完成对连续属性的离散化处理;4)能够对不完整数据进行处理。:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。 2. Thek-meansalgorithm 即K-Means算法k-meansalgorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k<n。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。 3. Supportvectormachines支持向量机,英文为Support