1 / 64
文档名称:

决策树ID3算法的改进研究.pdf

格式:pdf   页数:64页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

决策树ID3算法的改进研究.pdf

上传人:minzo 2014/5/14 文件大小:0 KB

下载得到文件列表

决策树ID3算法的改进研究.pdf

文档介绍

文档介绍:㈣㈧㈣决策树惴ǖ母慕芯工学硕士学位论文指导教师:所在单位:学位授予单位:计算机软件与理论计算机科学与技术学院哈尔滨工程大学硕士研究生:学位级别:学科、专业:论文提交日期:论文答辩日期:刘祺印桂生教授硕士年分类号:密级:编号:
摘要数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程,是信息处理技术研究领域的一项重要课题。它是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的以及有潜在应用价值的信息或模式的过程。它融合了数据库、人工智能、机器学****等多个领域的理论和技术。分类分析是数据挖掘技术研究的一个重要方向。数据挖掘中分类算法在商业应用最为广泛,而决策树算法又是数据挖掘分类的核心技术算法之一。晏岢龅腎算法在决策树算法中最为著名。本文主要研究决策树惴ḿ捌涓慕惴ā本文首先详细地介绍了惴ǎ缓蠖云浣辛松钊氲匮芯俊算法有两大缺点:第一,惴ㄓ捎谑褂胠进行计算,所以运算起来并不简单;第二,算法往往偏向于选择取值较多的属性,而取值较多的属性却不总是最优的属性。其次,为了解决惴ㄔ怂愀丛拥娜钡悖肼罂死土止式,在惴ǖ幕∩咸岢隽薎简化算法,使运算变得简洁;为解决算法偏向于选择取值较多的属性的不足,通过使用数据结构中的二叉树来存储决策树,在惴ɑ∩咸岢隽私獻简化算法与普通二叉树算法相结合的蚧惴ǖ亩媸鞔娲⑺惴āH缓笸ü褂猛练集的实例进行最后对不同算法建立的决策树进行比较研究,得到结论:通过对法、蚧惴ê虸简化算法的二叉树存储算法三种决策树算法的比较,证明应用蚧惴ǖ亩媸鞔娲⑺惴ū菼算法和蚧惴ǖ玫降关键词:决策树;惴ǎ蚧惴ǎ欢媸鞔娲⑺惴具体计算,分别得到其对应的决策树。决策树更为理想。哈尔滨工程大学硕士学位论文
甌琭甌馿蠢诚,篵哈尔滨工程大学硕士学俄论文。.,,
哈尔滨丁程大学硕士学位论文籌籦篸;
导师┳:\尹也碱瞥日期:弈辍菰鲁日乙邴年≥月/,麦日期:乙确年≥月化日哈尔滨工程大学学位论文原创性声明学位论文授权使用声明主/踩文中指出,并与参考文献相对应。除文中已注明引用的内容外,本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者┳:工程大学有权保留并向国家有关部门或机构送交论文的复印件。本论文谠谑谟柩缓蠹纯口在授予学位个月后本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在本论文不包含任何其他个人或集体已经公开发表的作品成果。对本人完全了解学校保护知识产权的有关规定,即研究生在校攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。解密后晒豕こ檀笱徒挥泄夭棵沤斜4妗⒒惚嗟取口。,
第滦髀研究背景和意义务处理已经被广泛应用于金融、证券、保险、销售以及天气预报、工随着计算机科学与技术的发展,越来越多的人们开始使用计算机,大量的信息给人们带来方便的露时,也给人们带来了许多新豹闯题。匿际互联霹的高速发展和电子商务的广泛应用,使人们利用信息技术生产数据的能力大幅度提高,成千上万的数据库被用于商业管理、政府办公、科学研究和工程开发等等。企业、政府部门和科学鞠体由于需要大量的信息和数据,因此产生了信息积累这一问题,每天都有大量的数据产生,信息量凡乎以每二十个月翻一番的速度剧增。如何从大量的数据中提取并发现有用信息以提供决策的依据,数据挖掘这一新型的数据分析技术诞生了。数据挖掘就是然大量的、不完全的、有噪声的数据中,提取新颖的、有效的和潜在有用的信息过程。数据挖掘的任务是扶数据集中发现模式。另一方面,由于数据库技术的发展和数据存储成本的降低以及数据库管理系统的广泛应用,大型数据库系统已经在各行各业普及。数据库和联机事业生产、分子生物学、基因王程研究、税务、海关等各行名业。对于这些积累的大量数据,人们己经不满足于传统的统计分析手段,而需要发现更深层次的规律,提供更高层次的数据分析功能,更加方便和有效的获取能带来效益的信息。在大量的数据背羼隐藏着谗多重要的不被人所知的倍息,这些信息可以很好地辅助人们进行决策。可是目前用于对这些数据进行分析处理的王具却很少。大量的数据使得数据挖掘成为选案的必要技术手段,数据挖掘技术也就应运而生。现在,数据挖掘已经作为一种从数据中发现隐含有用信息或知识的技术,伴随着数据仓库应用的增加也得到了进一步发展。数据挖掘是在没有明确假设的前提下去挖掘信息,发现知识,得到的是预先未曾预料到的、有效的和实用的信息,因此它可以有效的