1 / 46
文档名称:

多元统计分析判别分析课件.ppt

格式:ppt   大小:4,039KB   页数:46页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多元统计分析判别分析课件.ppt

上传人:卓小妹 2022/3/19 文件大小:3.94 MB

下载得到文件列表

多元统计分析判别分析课件.ppt

相关文档

文档介绍

文档介绍:关于多元统计分析判别分析
现在学习的是第1页,共46页
1.问题引入
2.思路点拨
3.判别分析方法
4.DNA序列分类问题的求解
5. 参考文献
目 录
现在学习的是第2页,共46页
首先,我们叶斯(Bayes)判别、费希尔(Fisher)判别、逐步判别、序贯判别等。这里,我们简单介绍三个常用的判别方法:距离判别、贝叶斯(Bayes)判别和费希尔(Fisher)判别。
现在学习的是第11页,共46页
判 别 分 析 方 法

(Bayes)判别
(Fisher)判别

显著性检验
现在学习的是第12页,共46页
距离判别
距离判别的基本思想:样品 X离哪个总体的距离最近,就判断 X 属于哪个总体。
这里的“距离”是通常意义下的距离(欧几里得距离:在 m 维欧几里得空间 R 中,两点 与
的欧几里得距离,也就是通常我们所说的距离为
)吗?
带着这个疑问,我们来考虑这样一个问题 :
现在学习的是第13页,共46页
设有两个正态总体 ,
和 ,
现在有一个新的样品位于 A 处(参见图1)
从图中不难看出: ,是否 A 处的样品属于总体 呢?
图 1
现在学习的是第14页,共46页
显然不是,因为从概率的角度来看,总体 的样本比较分散,而总体 的样本则非常集中,因此 处的样品属于总体 的概率明显大于属于总体 的概率,也就是说, 处的样品属于总体 的“可能性”明显大于属于总体 的“可能性”!这也说明了用欧几里得距离来度量样品到总体距离的局限性。因此,需要引入新的距离概念——这就是下面给出的马氏距离。
现在学习的是第15页,共46页
定义1(马氏距离):设总体 G 为 m 维总体 ( m 个因素或指标),其均值向量为 (这里 T 表示转置),协方差阵为
,则样品 到总体 G 的马氏距离定义为
现在学习的是第16页,共46页
两总体的距离判别
先考虑两个总体( )的情况。设有两个总体 和 , 和 分别是 和 的协方差阵, 和 分别是 和 的均值。对于新的样品 ,需要判断它来自那个总体。
设来自 ( )的训练样本为
其中 表示来自哪个总体, 表示来自总体 的样本量。
现在学习的是第17页,共46页
要判断新样品 来自哪个总体,一般的想法是分别计算新样品到两个总体的马氏距离 和 :
如果 则判定 ;
反之,如果 则判定 :

……(1)
A. 时的判别方法
现在学习的是第18页,共46页
其中 , ,


为了得到更简单的判别规则,我们下面计算新样品到两个总体的马氏距离 和
的差
现在学习的是第19页,共46页
显然,判别规则(1)式等价于
…… (2)
通常,称 为判别系数向量称 为线性判别函数。
注意判别准则(1)式或者(2)式将 维空间
划分成两部分: 和
也即 。距离判别的实质就是:给出空间 的一个划分 和 ,如果样品 落入 之中,则判定 ;如果样品 落入 之中,则判定

现在学习的是第20页,共46页
当 时,根据判别准则(1)式,我们同样的给出判别函数 为
相应的判别规则为
……(3)
B. 时的判别方法
现在学习的是第21页,共46页
在实际应用中,总体的均值和协方差阵一般是未知的,我们所知道的仅仅是一组样本或者观测值,在这种情况下,就需要利用数理统计的

最近更新