1 / 58
文档名称:

第四章判别分析.ppt

格式:ppt   大小:1,603KB   页数:58页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第四章判别分析.ppt

上传人:落意心 2022/6/18 文件大小:1.57 MB

下载得到文件列表

第四章判别分析.ppt

相关文档

文档介绍

文档介绍:第四章判别分析
内容和要求
内容:
判别分析简介、基本原理、判别分析方法
要求:
1、熟悉判别分析基本原理。
2、掌握常用的判别分析准则。
3、能熟练使用软件进行判别分析,并能对判别结果作深入讨论。
第一节类别之间距离的大小,判别其所属类别。
设 是从期望μ=    和方差阵Σ=
的总体G抽得的两个观测值,则称

为X与Y之间的Mahalanobis距离
样本X和Gi类之间的马氏距离定义为X与Gi类重心间的距离:
(二)两个总体距离判别法
先考虑两个总体的情况,设有两个协差阵相同的p维正态总体和,对给定的样本Y,判别一个样本Y到底是来自哪一个总体,一个最直观的想法是计算Y到两个总体的距离。故我们用马氏距离来指定判别规则,有:
1、方差相等
则前面的判别法则表示为
当 和已知时, 是一个已知的p维向量,W(y)是y的线性函数,称为线性判别函数。称为判别系数。用线性判别函数进行判别分析非常直观,使用起来最方便,在实际中的应用也最广泛。
常数项
例 在企业的考核中,可以根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的指标有:
资金利润率=利润总额/资金占用总额
劳动生产率=总产值/职工平均人数
产品净值率=净产值/总产值
三个指标的均值向量和协方差矩阵如下。现有二个企业,观测值分别为
(,,)和(,,),问这两个企业应该属于哪一类?
变量
均值向量
协方差矩阵
优秀
一般
资金利润率





劳动生产率





产品净值率





线性判别函数:
由此可以判断第一个企业属于优秀企业,第二个企业属于一般企业
2、当总体的协方差已知,且不相等
当总体的方差未知时,应该用样本的协方差矩阵代替。步骤如下(假如两个总体):
(1)分别计算各组的离差矩阵S1和S2;
(2)计算
(3)计算类的均值
(4)计算
(5)计算
      从而计算
(6)生成判别函数,将检验样本代入,得分,判类。
随着计算机计算能力的增强和计算机的普及,距离判别法的判别函数也在逐步改进,一种等价的距离判别为:
设有个K总体,分别有均值向量μi(i=1,2,…,k)和协方差阵Σi= Σ,各总体出现的先验概率相等。又设Y是一个待判样品。则距离为(即判别函数)
(三) 多总体的距离判别法
上式中的第一项Y’ Σ-1Y与i无关,则舍去,得一个等价的函数
将上式中提-2,得
则距离判别法的判别函数为:
判别规则为
注:这与前面所提出的距离判别是等价的.
(三)、判别分析效果检验
良好的判别效果即是指所建立的判别函数具有相当的稳定性和准确性,优良的判别函数应该是:一理论基础稳固,具有准确判别的能力;二回代错判率低;三具有良好的外部数据应用性质。
由于判别分析是假设两组或多组样品取自不同总体,因此要求样本各类型的均值向量在统计上具有显著差异,如能反映出显著差异,则判别函数显著,有能力将不同的类型区别开来。
所以对判别效果的检验即是对多元正态总体的均值向量是否相等进行检验,利用Hotelling T2统计量进行检验。
回代是指将训练样本依次代入判别函数,检查错判情况,回代错判率低即是指依训练样本建立的判别函数偏差小,建立方法可靠。
良好的外部应用性质是指该判别函数具有相当程度的稳定性,不仅适用于本训练样本,而且在大多数情况下具有普遍应用能力,这也正是我们建立判别函数想要达到的目的。
为检验外部性,可采用的方法有:

即判别函数建立完成后,重新再收集一部分数据,用判别函数进行判别,看错判是否严重。这种验证方法从理论上说较好,但再收集样本数据不