文档介绍:砌韘,鷖韘.№要髈盯鷈摘骶∞哂分类是数据挖掘领域研究的重要课题。常用的分类模型有决策树、神经网络、遗传算法、粗糙集等。本文主要研究决策树惴ḿ捌涓慕惴āJ紫炔隽司法存在的不足,提出了基于属性优先关联度的惴笛橹っ鰽性的缺点,随着数据规模的增大,决策树的分类性能也越来越好。最后,探讨了关键词:决策树,分类,Ⅱ埒算法,算法帆,篸策树的相关理论,并对几种典型的决策树算法进行了分析比较。然后,针对法加快了决策树的构建速度,同时也克服了惴ㄍ蛴谘≡袢≈到隙嗟氖算法在人力资源管理中的实际应用,结果分析进一步表明是有效的。,瓼瑃誸,珹,.,.,,甧琣、Ⅳ
砌韘,鷖韘.№要髈盯鷈摘骶∞哂分类是数据挖掘领域研究的重要课题。常用的分类模型有决策树、神经网络、遗传算法、粗糙集等。本文主要研究决策树惴ḿ捌涓慕惴āJ紫炔隽司法存在的不足,提出了基于属性优先关联度的惴笛橹っ鰽性的缺点,随着数据规模的增大,决策树的分类性能也越来越好。最后,探讨了关键词:决策树,分类,Ⅱ埒算法,算法帆,篸策树的相关理论,并对几种典型的决策树算法进行了分析比较。然后,针对法加快了决策树的构建速度,同时也克服了惴ㄍ蛴谘≡袢≈到隙嗟氖算法在人力资源管理中的实际应用,结果分析进一步表明是有效的。,瓼瑃誸,珹,.,.,,甧琣、Ⅳ
巡声关于学位论文使用授权的说明£圣查明尸芰浚喝婷艿难宦畚脑诮饷芎笞袷卮斯娑果。据本人所知,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说期:本人完全了解华北电力大学有关保留、使用学位论文的规定,即:①学校有权保管、并向有关部门送交学位论文的原件与复印件;②学校可以采用影印、缩印或其它复制手段复制并保存学位论文;③学校可允许学位论文被查阅或借阅;④学校可以学术交流为目的,复制赠送和交换学位论文;⑤同意学校可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。作者签名:导师签名:日本人郑重声明:此处所提交的硕士学位论文《决策树分类算法的研究及应用》,是本人在华北电力大学攻读硕士学位期间,在导师指导下进行的研究工作和取得的研究成或撰写过的研究成果,也不包含为获得华北电力大学或其他教育机构的学位或证书而使明并表示了谢意。学位论文作者签名:
第一章引言选题背景及意义国内外研究动态新领域,它融合了数据库、人工智能、机器学****数理统计学、模糊数学等多个领质;预测性数据挖掘分析数据,建立一个或一组模型,产生关于数据的预测,包括分类和回归。分类可用于提取描述重要数据的模型或预测未来的数据趋势。分类技术是数据挖掘的重要分支,它能够对各个行业提供良好的决策支持,对型掷嗥,该模型能把数据库中的数据映射到给定类别中的某一个。分类研究在国外发展很快,已有很多的算法和模型。因此,研究数据分类对数据挖掘技术有很用于分类挖掘技术的方法有很多,如决策树方法、遗传算法、贝叶斯网络、粗解、、效率较高等优点被广泛研究与应用。目前决策是对训练数据样本集建立一棵决策树,利用建好的决策树,对数据进行预测。决策树的建立可以看成是分类规则的生成过程,因此可以认为,决策树实现了数据分类规则的可视化,其输出结果也容易理解。目前,分类挖掘在实际应用中有着很重要的应用价值,在很多行业领域都取得了一定的成功。比如:在股票市场上对每只股票的历史数据进行分析,通过相应的技术进行预测,从而做出相对比较准确的判断;彩票的购买也可以利用数据挖掘的分类或预测技术进行分析;在金融领域中将贷款对象分为低贷款风险与高贷款风险两类。通过决策树,可以很容易地确定贷款申请者是属于高风险的还是低风险的。由于决策树方法在分类挖掘技术中有着独特的优势,因此对决策树分类算法的研究有着多层次的研究价值和很高的应用价值。目前,在许多数据挖掘系统应用中,决策树技术已经得到了研究者和软件公司数据挖掘【卜,丛从谑菘庵械闹J斗⑾,,它可以沂鞘菘庋芯恐械囊桓龇浅S杏τ眉壑档域的理论和技术。从数据分析的观点来看,数据挖掘分为两类:描述性数据挖掘和预测性数据挖掘。描述性数据挖掘以概要方式描述数据,提供数据所具有的一般性整个社会的发展产生重要而深远的影响。分类的目的是构造一个分类函数或分类模大的意义。糙集、盍俳椒ā⒐亓9嬖蚍椒ǖ鹊取F渲校霾呤鞣椒ㄒ云渌惴ㄈ菀妆蝗死树方法中比较流行的算法有、、和等。这些算法都华北电力大学硕十学位论文
掘解决方案,提供多种知识发现方法。曲以看作是惴ǖ囊桓隼┱梗行У孛植沽薎算法的缺点。.虸最终生成多叉树。,在嘀刑岢隽嗽佣认骷醯母拍睿丛佣认骷踝畲蠓至呀诘闵ぞ霾呤鳎与煌氖牵珻玎最终生成二叉树,然后利用重采样技术