文档介绍:第19章 判别分析
SAS软件应用之判别分析
学****目标
了解判别分析的基本思想;
熟悉Bayes判别分析法和Fisher判别分析法;
掌握BAYES参数分析法的判别准则效能的评估;
掌握判别分析的SAS过程步:DISCRIM、CANDISC和STEPDISC过程步。
SAS软件应用之判别分析
概述
在医学研究和疾病防治工作中,经常会遇到需要根据观测到的资料对所研究的对象进行分类的问题。例如,需要根据就诊者的各项症状、体征及化验指标,作出就诊者是否患有某种疾病或某种疾病的哪一类型的诊断;又如,在环境监测中,根据对某地区的环境污染的综合测定结果判断该地区属于哪一种污染类型等。
SAS软件应用之判别分析
概述
判别分析的任务是根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。判别分析是对样本个体进行分类的另一种统计分析方法,它和聚类分析一样,都可以将样本个体按其具有的特性进行分类。
SAS软件应用之判别分析
概述
聚类分析和判别分析有很大的区别,判别分析是根据一批分类明确的样本在若干指标上的观察值,建立一个判别函数和判别准则,然后以此准则对新的样本进行分类。由此可知,这两种分类方法有着本质的不同:①聚类分析可以对样本进行分类,也可以对指标进行分类;而判别分析只能对样本进行分类;②聚类分析事先不知道事物的类别,也不知道分几类;而判别分析必须事先知道事物的类别,也知道分几类;③聚类分析不需要分类的历史资料,而直接对样本进行分类;而判别分析需要分类历史资料去建立判别函数,然后才能对样本进行分类。
SAS软件应用之判别分析
判别分析
判别分析是一种根据观测变量判断研究样本如何分类的多变量统计方法,它对于需要根据对样本中每个个案的观测来建立一个分组预测模式的情况是非常适用的。分析过程基于对预测变量的线性组合产生一系列判别函数,但是这些预测变量应该能够充分地体现各个类别之间的差异。判别函数是从一个每个个案所属的类别已经确定的样本中拟合出来的,并且生成的函数能够运用于同样进行了预测变量观测的新的样本点,以判断其类别归属。
SAS软件应用之判别分析
判别分析
判别分析的基本原理可以表述为:在一个P维空间R中,有K个已知的总体G1,G2,G3,…,GK,同时有样本点X(X1,X2,X3,…,XP),它属于且仅属于这K个总体中的一个,判别分析所要解决的问题是确定这个样本点X具体应该属于那一个G总体。实际上判别分析的过程分为两个部分,首先是依据已知样本及其预测变量建立起一系列分类规则或判别规则,其次是运用这一规则对样本的原有分类进行检验以确定原有分类错判率。同时如果原有分类具有较低的错判率,则建立起来的分类规则可以应用于实际工作中。
SAS软件应用之判别分析
判别分析
判别分析的基本思想是根据一批分类明确的样本在若干指标上的观察值,建立一个关于指标的判别函数和判别准则,然后根据这个判别函数和判别准则对新的样本进行分类,并且根据回代判别的准确率评估它的实用性。例如,以一批正常和一批已确诊的病人为样本,收集他们的各项指标,如化验指标、X线、心脑电图、超声波等诊断指标,然后利用这批分类明确的样本在这些指标上的观察值,建立一个关于指标的判别函数和判别准则(区分正常人和病人的方法),使得按此准则来判断这批样本归属的正确率达到最高。它有着广泛的应用价值,尤其在计算机疾病辅助诊断等医学科学研究中起了重要作用。
SAS软件应用之判别分析
判别分析
判别函数是一个关于指标变量的函数。每一个样本在指标变量上的观察值代入判别函数后可以得到一确定的函数值,将所有样本按其函数值的大小和事先规定的判别原则分到不同的组里,并使得分组结果与原样本归属最吻合。这就是判别分析方法的基本过程。进行判别分析的目的是根据样本建立判别函数和判别准则,用以对新的样本进行归类。不同判别分析方法的区别在于其建立判别函数的方法和判别准则的规定是不同的。
SAS软件应用之判别分析
判别分析
判别分析的方法中较常使用的有Bayes判别分析法和Fisher判别分析法。Fisher判别分析法是以距离为判别准则来分类,即样本与哪个类的距离最短就分到哪一类;而Bayes判别分析法是以概率为判别准则来分类,即样本属于哪一类的概率最大就分到哪一类。前者仅适用于两类判别,后者适用于多类判别。
对判别分析结果的优劣评价明确尚无系统的检验理论,只能通过错判率和事后概率错误率的估计来评估判别分类的有效性。
SAS软件应用之判别分析