1 / 10
文档名称:

数据挖掘报告.docx

格式:docx   大小:148KB   页数:10页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘报告.docx

上传人:碎碎念的折木 2022/6/30 文件大小:148 KB

下载得到文件列表

数据挖掘报告.docx

文档介绍

文档介绍:数据挖掘报告 8 7 2 8 4
认真整理的精品 word 文档,下载即可编辑!!
2
细心整理,认真做精品
哈尔滨工业高校
数据挖掘理论与算例子〕:
认真整理的精品 word 文档,下载即可编辑!!
细心整理,认真做精品
由于试验承受的是 10-fold 穿插验证,因此最终准确率应当是每一折准确率的平均值。上述代码也包含了训练决策树和使用测试集验证决策树的代码,即:
该试验的最终准确率约是:test right rate:
基于树桩的Adaboost 算法
在python 中同样也实现了adaboost 算法,需要使用AdaBoostClassifier〔〕方法构造它。它有假设干可选项:
base_estimator 是设置adaboost 算法使用的弱分类器,默认是一层决策树,即树桩。
7
n_estimators 是设置迭代次数,每一次迭代时该算法选择数据集中的某一特征作为树桩的分类节点,训练集中被错误分类的记录将被增加权重,正确分类的记录将被降低权重,权重更新后的数据集将用于下一次迭代。初始时各个记录权重均为 1/n,n 为记录数目。
主要的实现语句如下:
……
最终在测试集上,由adaboost 生成的强分类器的准确率为:
kmeans 算法
读取数据集
Kmeans 算法的数据集是酒的品种数据。有 13 个属性,一个分类属性。共分成 3 类,数据集前 58 号为第一类,59-129 号为其次类,130-177 号为第三类。
初始化kmeans 参数
Python 包中的kmeans 类来创立方法实例。需要设置的主要参数是n_clusters,即聚簇数量。具体代码如下:
固然可以设置init 参数为random,表示随机生成初始质心。默认值的kmeans++,智能选择数据中的假设干项作为质心。
8
认真整理的精品 word 文档,下载即可编辑!!
细心整理,认真做精品
还有max_iter 可选项,表示kmeans 方法迭代次数。
聚类划分
聚簇划分代码如下:
错误率
计算聚簇划分的错误率,代码
结果:
[1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
1
1
2
2
1
1
2
1
1
1
1
1
1
2
2
1
1
2
2
1
1
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
2
0
2
0
0
2
0
0
2
2
2
0
0
1
2
0
0
0
2
0
0
2
2
0
0
0
0
0
2
2
0
0

最近更新

2024年互联网数据中心(IDC)调研及发展前景分析.. 15页

《工程力学压杆稳定》 36页

《工程建设施工合同》 75页

2024年瘦身化学品项目投资申请报告代可行性研.. 59页

2024年食品、饮料、烟草专用生产设备零件项目.. 65页

2024年三乙胺项目资金筹措计划书代可行性研究.. 67页

2024年熔融指数仪项目资金筹措计划书代可行性.. 66页

2024年热熔胶网膜项目投资申请报告代可行性研.. 75页

2024年曲轴车床项目资金申请报告代可行性研究.. 72页

161725238 赵悦 五星级酒店宴会部服务质量提升.. 24页

2024年膏药项目合作计划书 51页

2024年钒项目合作计划书 63页

2024年打捞船项目合作计划书 56页

2024年差压变送器项目合作计划书 50页

2024年苯噻草胺项目合作计划书 60页

2024年PCM脉码调制终端设备项目发展计划 75页

高中化学精品《乙酸 23页

高考化学考试说明学习元素化合物部分 44页

高中化学:承载能力与素养考查的元素化合物 24页

肇庆裹蒸粽行业报告 28页

云南省市政基础设施工程施工质量验收统一规程.. 82页

绘画心理学 2页

2021年歌颂祖国的三句半台词 8页

机械设备投标书范本1 37页

少先队六知六会 1页

景观工程新材料在当代景观中的应用 6页

认罪认罚从宽制度的理解与适用课件 25页

基于PLC电梯控制系统设计 35页

《JJF1069-2016《法定计量检定机构考核规范》.. 3页