1 / 11
文档名称:

判别分析和聚类分析.ppt

格式:ppt   大小:750KB   页数:11页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

判别分析和聚类分析.ppt

上传人:卓小妹 2022/4/25 文件大小:750 KB

下载得到文件列表

判别分析和聚类分析.ppt

文档介绍

文档介绍:判别分析和聚类分析
第1页,共11页,编辑于2022年,星期五
一、判别分析
二、聚类分析
本讲结构
第2页,共11页,编辑于2022年,星期五
一、判别分析
回归分析,判别分析,聚类分析被称为多元统计的三大方法.
判别分析和聚类分析
第1页,共11页,编辑于2022年,星期五
一、判别分析
二、聚类分析
本讲结构
第2页,共11页,编辑于2022年,星期五
一、判别分析
回归分析,判别分析,聚类分析被称为多元统计的三大方法.
判别分析(discriminant analysis)是根据要判别对象的若干个指标的观测结果判断其应属于已知类中的哪一类的统计学方法.
经典的判别分析方法有:Fisher判别和Bayes判别,原理都是建立判别函数使得错判率达到最小.
第3页,共11页,编辑于2022年,星期五
判别分析方法SPSS实现步骤
1. 选择classify→discriminant;
2. 选择分类变量(Grouping Variable),定义分类范围数(1~n);
3. 选择分类指标变量(Independents);
4. 设置统计量Statistics中的Fisher系数,Classify中的判别符合率表Summary table;
例:
第4页,共11页,编辑于2022年,星期五
5. 由Fisher判别函数计算要判别的对象, 哪个判别函数计算的值最大,该判别对象就属于哪一类.
第5页,共11页,编辑于2022年,星期五
二、聚类分析
聚类分析(Cluster Analysis)是按”物以类聚”的原则将特性相近的对象进行归类.
SPSS中的聚类分析按数据的排列位置分为变量聚类(Variables)和样品(Cases)聚类两类.
SPSS中的聚类分析按方法分为三种:
两步聚类(TwoStep Cluster)
K类中心聚类(K-Means Cluster)
系统聚类(Hierarchical Cluster)
第6页,共11页,编辑于2022年,星期五
系统聚类(Hierarchical Cluster)的基本思想
(1)相近的聚为一类(以距离表示);
(2)相似的聚为一类(以相似系数表示);
最短距离法(single linkage)
最长距离法(complete linkage)
中间距离法(median method)
可变距离法(flexible median)
重心法(centroid)
类平均法(average)
可变类平均法(flexible average)
Ward最小方差法(Ward’s minimum variance)
第7页,共11页,编辑于2022年,星期五
构造n个类,每个类包含且只包含一个样品。
计算n个样品两两间的距离,构成距离矩阵,记作D0;
合并距离最近的两类为一新类;
计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3);
画聚类图;
决定类的个数,及各类包含的样品数,并对类作出解释。
系统聚类的基本步骤
第8页,共11页,编辑于2022年,星期五
聚类(cluster)
分成几类?
每个样品属于哪一类?
判别(discriminate)
已知分成几类;
根据训练样品建立判别函数;
根据判别函数对待判样品进行归类.
聚类与判别的区别
第9页,共11页,编辑于2022年,星期五
例: 对11项血常规和生化指标进行聚类.
选择聚类方式 Cluster→Variables;
选择要聚类的11个变量;
设置其他需要的选项(可以采用默认值);
第10页,共11页,编辑于2022年,星期五
聚类结果(冰状聚类图):
说明:空白处的叉起连接作用, 那些是一类是一目了然
第11页,共11页,编辑于2022年,星期五