文档介绍:一、 实验目的
使用数据挖掘中的分类算法,对数据集进行分类训练并测试。应用不同的分类算法,比 较他们之间的不同。与此同时了解Weka平台的基本功能与使用方法。
二、 实验环境
实验采用Weka平台,数据使用Weka安装目录下data文,并在Explorer中将功能面板切换到“Classify”。点 “Choose”按钮选择“functions,选择LibSVM分类算法。
在Test Options面板中选择Cross-Validatioin folds=10,即十折交叉验证。然后点 击“start”按钮:
使用LibSVM分类算法训练数据集得出的结果
参数:-S 0 -K 2 -D 3 -G -R -N -M -C -E -P
==Cliassifier model (full training set)=
LibS睇 wrapper, original cods by Passer EL-Mansialawy (= KLS\M)
Time taken to b- node 1; 0«02 aeconda
== Stratified er022-validatlon = ==Suirmarv ===
Correctly Classified Instances
145
%
Incorrectly Classified InatiaiLCES
5
%
Kiappia aciatistic
Mean absolute error
rqoe mean squared error
Relative at'^DluLc error
5 %
Root r-eLative acpiared error
31B 5228 %
Total Number of Instances
150
== Detailed Accuriac? Ey Class ===
IP Ra^e FF Rate
Pre ci s ion Reciall
F-Measure ROC Area Class
1 0
1 1
1 1 Iris-setDsa
C、94 0„02
Qb959
CL 949 0- 9€ Iris-versicolor
0„03
Qb941 th 驱
CL 95 0- 9f5 Ins-virginica
Weighted Avg„
QB 957
= Confusion Matrix =
a b c classified as
50 0 0 I a = Iria-setDsa
0 47 3 I b = Iri3-veraicdIor
0 2 48 I c = Iris-Yirginica
结果分析:
使用该参数指定的LibSVM训练数据集,得到准确率为%,其中150个实例中的145个被正确 分类,5个被错误分类。根据混淆矩阵,被错误分类实例的为:2个b类实例被错误分类到 c; 3个c类实例被错误分类到b。该算法P=,R=,ROC面积为。
将模型应用于测试集:
使用LibSVM分类算法测试数据集得出的结果
=Se-evaluation on test set
incr-eirenzally
Attributes:
=munanmEY
150
=== Detailed Accuracy By
TP Rate
Precision
Recall
ROC Are a
Class
分类误差:
i圄 Weka Cla ssifi e r Vi sua I ize: 10:01:47 - fu ncti □ ns. LibSVM (iris)
Select Instsr
6-9
Class colour
结果分析:
准确率为%,只有两个实例被错误分类。P=, R=, ROC面积为
潟£瑚
Rc-ot mean square! error
I de al Nmrfc>er of insL ances
Select the attribute for the y axis
test set
iris
uaknown (yet) . Reading 5
Cc-rrectly Cliassified Instances
Incorrectly Classified Instances
Kiappa statistic
Mean absolute error
User supplie