1 / 63
文档名称:

什么是判别分析.ppt

格式:ppt   大小:2,489KB   页数:63页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

什么是判别分析.ppt

上传人:落意心 2022/1/8 文件大小:2.43 MB

下载得到文件列表

什么是判别分析.ppt

文档介绍

文档介绍:什么是判别分析
第一节 引言
在我们的日常生活和工作实践中,常常会遇到判别分析问题,即根据历史上划分类别的有关资料和某种最优准则,确定一种判别方法,判定一个新的样本归属哪一类。例如,某医院有部分患有肺炎、肝炎、冠心病、糖尿病等病人的资料,记录了每个患者若干项症状指标数据。现在想利用现有的这些资料找出一种方法,使得对于一个新的病人,当测得这些症状指标数据时,能够判定其患有哪种病。又如,在天气预报中,我们有一段较长时间关于某地区每天气象的记录资料(晴阴雨、气温、气压、湿度等),现在想建立一种用连续五天的气象资料来预报第六天是什么天气的方法。这些问题都可以应用判别分析方法予以解决。
把这类问题用数学语言来表达,可以叙述如下:设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)G1,G2, …,Gk中的某一类,且它们的分布函数分别为F1(x),F2(x), …,Fk(x)。我们希望利用这些数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来,并对测得同样p项指标(变量)数据的一个新样本,能判定这个样本归属于哪一类。
判别分析内容很丰富,方法很多。判断分析按判别的总体数来区分,有两个总体判别分析和多总体判别分析;按区分不同总体所用的数学模型来分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。本章仅介绍常用的几种判别分析方法:距离判别法、Fisher判别法、Bayes判别法和逐步判别法。
第二节 距离判别法
一 马氏距离的概念
二 距离判别的思想及方法
三 判别分析的实质
一、马氏距离的概念

为此,我们引入一种由印度著名统计学家马哈拉诺比斯(Mahalanobis, 1936)提出的“马氏距离”的概念。
二、距离判别的思想及方法
1、两个总体的距离判别问题
问题:设有协方差矩阵∑相等的两个总体G1和G2,其均值
分别是1和 2,对于一个新的样品X,要判断它来自哪个总体。
一般的想法是计算新样品X到两个总体的马氏距离D2(X,
G1)和D2(X,G2),并按照如下的判别规则进行判断
这个判别规则的等价描述为:求新样品X到G1的距离与到G2
的距离之差,如果其值为正,X属于G2;否则X属于G1。