1 / 39
文档名称:

聚类分析的分析方法.ppt

格式:ppt   大小:2,505KB   页数:39页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析的分析方法.ppt

上传人:石角利妹 2022/4/17 文件大小:2.45 MB

下载得到文件列表

聚类分析的分析方法.ppt

文档介绍

文档介绍:聚类分析的分析方法
本讲稿第一页,共三十九页
SPSS中的聚类分析
Spss中的聚类功能常用的有两种:
快速聚类(迭代过程):
K-Means Cluster
系统聚类:Hierarchical Cl 皮尔逊相关系数(R)
切比雪夫距离
(二)各种距离和相似系数(亲疏关系指标)
本讲稿第九页,共三十九页
绝对值距离
明考斯基

本讲稿第十页,共三十九页
本讲稿第十一页,共三十九页
Statistics
聚类进度表
相似矩阵
样品或变量的分类情况
本讲稿第十二页,共三十九页
本讲稿第十三页,共三十九页
凝聚状态表的第一列表示聚类分析的第几步;第二列、第三列表示本步聚类中哪两个样本或小类聚成一类;第四列是相应的样本距离或小类距离;第五列、第六列表明本步聚类中,参与聚类的是样本还是小类。0表示样本,数字n(非0)表示由第n步聚类产生的小类参与本步聚类;第七列表示本步聚类的结果将在下面聚类的第几步中用到。
本讲稿第十四页,共三十九页
本讲稿第十五页,共三十九页
Plot
树状结构图
冰柱图
冰柱的方向
本讲稿第十六页,共三十九页
Number of clusters
Case
X7
X5
X4
X3
X6
X8
X2
X1
1
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
2
X
X
X
X
X
X
X
X
X
X
X
X
X
X
3
X
X
X
X
X
X
X
X
X
X
X
X
X
4
X
X
X
X
X
X
X
X
X
X
X
X
5
X
X
X
X
X
X
X
X
X
X
X
6
X
X
X
X
X
X
X
X
X
X
7
X
X
X
X
X
X
X
X
X
Vertical Icicle
6
7
本讲稿第十七页,共三十九页
冰柱图因其样子非常象冬天房顶垂下的冰柱得名,它以图形的方式显示层次聚类分析结果,一般从冰柱图的最后一行开始观察,第一列表示类数。两样品之间的“х”表示将其两边的样品(类)联结起来聚成新类。
本讲稿第十八页,共三十九页
本讲稿第十九页,共三十九页
应用举例:
4-1
本讲稿第二十页,共三十九页
首先对表4-1中的原始数据进行标准化变换处理,经过运算使数据标准化得到表4-2,使它的每列数据的平均值为0,方差为1,这样表4-1中5列具有不同量纲、不同数量级的数据
不同地区数据求出欧氏距离。
就能放在一起比较;其次用表4-2中经过标准化处理后的30个
本讲稿第二十一页,共三十九页
本讲稿第二十二页,共三十九页
本讲稿第二十三页,共三十九页
表4-1
本讲稿第二十四页,共三十九页
本讲稿第二十五页,共三十九页
表 4-2
本讲稿第二十六页,共三十九页
本讲稿第二十七页,共三十九页
本讲稿第二十八页,共三十九页
K-Means Cluster聚类
本讲稿第二十九页,共三十九页
K-Means Cluster原理
首先,选择n个数值型变量参与聚类分析,最后要求的聚类数为k个;
其次,由系统选择k个(聚类的类数)观测量(也可由用户指定)作为聚类的种子。
第三,按照距离这些类中心的距离最小的原则把所有观测量(样品)分派到各类重心所在的类中去。
第四,这样每类中可能由若干个样品,计算每个类中各个变量的均值,以此作为第二次迭代的中心;
第五,然后根据这个中心重复第三、第四步,直到中心的迭代标准达到要求时,聚类过程结束。
本讲稿第三十页,共三十九页
K-Means Cluster聚类过程
由Analyze——Classify
——K-Means Cluster
将个变量放入Variable ;
输入最后聚类的个数;
本讲稿第三十一页,共三十九页
例 饮料数据(spssex/ )
16种饮料的热量、咖啡因、钠及价格四种变量
本讲稿第三十二页,共三十九页
快速聚类
本讲稿第三十三页,共三十九页
选项
读写凝聚点
人为固定分类数
ANOVA表,
初始凝聚点等