文档介绍:《数据挖掘》实验报告数据挖掘实验报告《数据挖掘》实验报告实验序号: 实验项目名称:、班12数学金融实验地点实验楼5-、实验目的及要求1:选择一个数据挖掘标准数据集,
实验序号: 实验项目名称:《数据挖掘》实验报告实验序号: 实验项目名称:、班12数学金融实验地点实验楼5-、实验目的及要求1:选择一个数据挖掘标准数据集,
学号
姓名
专业、班
12数学金融
实验地点
实验楼5-510
指导教师
潘巍巍
实验时间
一、实验目的及要求
1:选择一个数据挖掘标准数据集,,给出分类精度,。
2:在数据挖掘标准数据集上,实验对比剪枝与未剪枝的树的分类性能。
3:
二、实验设备(环境)及要求
电脑 WEKA
实验内容与步骤
(3)数据分类()
(2)
结果为
其中分类精度为50%
生成的决策树为
分类规则:
J48 pruned tree
------------------
outlook = sunny
| humidity = high: no ()
| humidity = normal: yes ()
outlook = overcast: yes ()
outlook = rainy
| windy = TRUE: no ()
| windy = FALSE: yes ()
剪枝后结果为
% 性能变好
优点: 分类精度高,生成的分类规则比较简单,易于理解。
缺点: 需要多次扫描数据集,比较低效
五、分析与讨论
六、教师评语
签名:
日期:
成绩
《数据挖掘》实验报告数据挖掘实验报告《数据挖掘》实验报告实验序号: 实验项目名称:、班12数学金融实验地点实验楼5-、实验目的及要求1:选择一个数据挖掘标准数据集,
实验序号: 实验项目名称:KNN算法数据挖掘实验报告《数据挖掘》实验报告实验序号: 实验项目名称:、班12数学金融实验地点实验楼5-、实验目的及要求1:选择一个数据挖掘标准数据集,
学号
姓名
专业、班
12数学金融
实验地点
实验楼5-510
指导教师
潘巍巍
实验时间
实验目的及要求
1:KNN算法的基本思路、步骤。
2:选择UCI中的5个标准数据集,使用KNN算法在该数据集上计算混淆矩阵。
3:选择2个数据集,选择不同的k值,k=1,3,5,7,9,对比KNN算法计算结果的差异。
二、实验设备(环境)及要求
电脑 WEKA
实验内容与步骤
contact-
两者的混淆矩阵分别为
两个数据集在K=1,3,5,7,9下结果分别为
Glass:
K=1;
=== Summary ===
Correctly Classified Instances 151 %
Incorrectly Classified Instances 63 %
Kappa statistic
Mean absolute error
Root mean squared error
Relative absolute error %
Root relative