文档介绍:SPSS数据分析-聚类分析
提纲
聚类分析简介
聚类分析原理
具体实例
聚类分析简介
根据对象的某些属性把它们分到一些组中,使得同组内的对象尽可能地相似,不同组中的对象尽可能地不一样,即所谓的聚类分析。
聚类分析简介
根据对样品聚类还是对变量聚类,聚类分析分Q型聚类和R型聚类。对变量的聚类称为R型聚类,而对样品(即观测值)聚类称为Q型聚类。通俗讲,R型聚类是对数据中的列分类,Q型聚类是对数据中的行分类。
聚类分析原理
从一批样品的多个观测指标中,找出能度量样品之间或指标(变量)之间相似程度或亲疏关系的统计量,构成一个对称相似性矩阵,并按相似程度的大小,把样品或变量逐一归类。
相关系数或距离
聚类分析原理
“距离”
聚类分析原理
“相关系数”
Excel计算
标准化值=(原始数据-均值)/标准差
聚类分析原理
“相关矩阵”[数据]-[数据分析]-[相关系数]
聚类分析原理
聚类过程
。
。
。
,这样就形成了一个新的组合样品。
。
。
,直到把所有样品都归类完毕。
聚类分析原理
聚类过程
,按下列原则构成类关系图。
若两个样品在已经连接成的组中未出现过,则它们连接成一个新组。
若两个样品中有一个在某组中出现过,则另一个就加入该组。
若两个样品都在同一组中,则这对样品不再分组。
若两个样品都在不同组中出现过,则把这两组连接在一起。