文档介绍:word
word
1 / 7
word
实验二 用身高和/或体重数据进展性别分类的实验
一、实验目的
1) 加深对Fisher线性判别方法原理的理解和认识
2) 掌握Fisher线性判别方法的设计方法
二、实验数据
训练样本集
50个女生的身高、体重数据
50个男生的身高、体重数据
测试样本集
35个同学的身高、体重、性别数据〔15个女生、20个男生〕
300个同学的身高、体重、性别数据〔50个女生、250个男生〕
三、实验容
试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进展比拟。
同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器〔例如: 最小错误率Bayes分类器〕也画到图上,比拟结果的异同。
四、原理简述、程序流程图
1、Fisher线性判别方法
首先求各类样本均值向量,
然后求各个样本的来离散度矩阵,
再求出样本的总类离散度,
根据公式求出把X投影到Y的最好的投影方向。
再求出一维Y空间中各类样本均值,其中,
word
word
2 / 7
word
本次实验的分界阈值我们用如下方法得到:,
最后,将测试样本中的值代入,求出y,并将其与y0来进展比拟来分类。
2、流程图
五、实验结果
1、错误率表格
男生错误个数
女生错误个数
总错误
男生错误率
女生错误率
总错误率
27
2
29
%
4%
%
8
4
12
16%
8%
12%
分析:用训练样本得到的分类器测试测试样本时错误率低,测试结果较好,但测试训练样本时,其错误率较高,测试结果不好。
2、Fisher判别方法图像
word
word
3 / 7
word
分析:从图中我们可以直观的看出对训练样本Fisher判别比最大似然Bayes判别效果更好。
六、总结与分析
本次实验使我们对加深Fisher判别法的理解。通过两种分类方法的比拟,我们对于同一种可以有很多不同的分类方法,各个分类方法各有优劣,所以我们更应该熟知这些已经得到充分证明的方法,在这些方法的根底上通过自己的理解,创造出更好的分类方法。所以模式识别还有很多更优秀的算法等着我们去学****br/>七、附录
word
word
4 / 7
word
1.
function [w,y0]=fisher(AA,BB)
A=AA';
B=BB';
[k1,l1]=size(A);
[k2,l2]=size(B);
M1=sum(AA);
M1=M1';
M1=M1/l1;%男生均值向量
M2=sum(BB);
M2=M2';
M2=M2/l2;%女生均值向量
S1=zeros(k1,k1);%建立矩阵
S2=zeros(k2,k2);
for i=1:l1
S1=S1+(A(:,i)-M1)*((A