1 / 39
文档名称:

数据挖掘6个实验实验报告.docx

格式:docx   大小:884KB   页数:39页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘6个实验实验报告.docx

上传人:dlmus2 2022/9/1 文件大小:884 KB

下载得到文件列表

数据挖掘6个实验实验报告.docx

相关文档

文档介绍

文档介绍:中南民族大学
计算机科学学院
综合实验报告
姓 名
年 级
专 业 软件工程
指导教师
学 号
序 号
实验类型 综合型
成绩评定
评语:
教师签名: 年 月 日
2016年12月10 日
年级
.938

Viral
Bacterial
===Confusion Matrix ===
a b <-- classified as
5 1 | a = Viral
0 4 | b = Bacterial
分析:①该输出结果给出了决策树的结构,该决策树共有六个节点,其中四个节点为叶子。该决策 树的检验数据为训练数据,检验的结果为分类的正确实例数占90%,分类错误的实例数占10%。由 最后的混淆矩阵可看出,有5个实际为Viral的实例,正确的分到了 Viral类中;有4个实际为Bacterial 的实例也被正确的分类到了 Bacterial类中;但是有一个实际为Viral的实例却被错误的分到了 Bacterial 类中。②通过分类正确率可对分类模型的质量进行初步评估,因本例中该值为90%,可以认为模型的 性能较好。但是本例中使用的数据为训练数据,所以模型在未来的未知数据中所表现的性能还不能 通过现在的分类正确率进行评估。
感冒类型诊断决策树:
[£ Weka Classifier Tree Visuallzer: 20:23:30 -tree...
Tree YLew
Sore-throat
■= Good'
■= NO'

Cluster centroids:
Cluster#
Attribute
Full Data
0
1
(10)
(5)
(5)
Increased-lym
Yes
Yes
No
Leukocytosis
Yes
No
Yes
Fever
Yes
Yes
Yes
Acute-onset
Yes
Yes
No
Sore-throat
Yes
No
Yes
Cooling-effect
Good
Good
Notgood
Group
Yes
Yes
No
Time taken to build model (full training data) : 0 seconds
===Model and evaluation on training set ===
Clustered Instances
0 5 ( 50%)
1 5 ( 50%)
Course
)
Weka : Instance infc
,预测某个学生是否决定去打篮球。
分析:由上图可知,这个被错误分到簇Clusterl中的是实例7。
Plot : 20:4&:58 - SimpleKMeana (ColdT^pE-tr
Inatance: 7
未剪枝的决策树:
国 W己k宙 Classifier Tree Visuallizer: 21:09:21 -
Inst ance numbe r
Iiige自非日一 Lym
LEuliDcytaaia
Fever
Acute-onae t
Gq-q-1 ing-e^
Seou-P
Cold-type
Viral
Cluster
clusterl
-Sunn/
Yes ()'
'二 Rain'
'No )'
urse
ather
剪枝后的决策树:
国 Weka Classifier Tree Visualizer: 21:09:21 - trees」..
'No ()'
-Sunny'
'二 Rain'
7es ()1
'No ()1
通过本次实验,我掌握ARFF数据文件的编制方法,并且学会了应用Weka
软件建立决策树的方法,并理解决策树的剪枝和未剪枝的分类效果。
实 验 收 获
分析:由上图可知,未剪枝和剪枝的决策树是一样的,理论上应该是有差别的,可能 因为此例中数据量过少,所以它们的差别没有显现出来。
实验
分项
2、决策树(2)
(1)进一步熟悉Weka软件的环境和基本用法;

(2)学****应用Weka软件建立决策树的方法,并理解决策树的剪枝和未剪枝的分类

效果。


一、具体题目:
1、。使用来自UCI的Credit screening database数据集,应用weka
的J48算