文档介绍:聚类分析聚类分析
概述
K-means Cluster过程(快速聚类法)
Hierarchical Cluster过程(系统聚类法) For EvaluationOnly. Copyright (c)pany,2004-2007 Edited byFoxitPDFEditor
综合实例
SPSS暑期教师特训班 1
概概述述
方法原理
按距离的远近划分类别
用途
细分市场
消费行为划分
设计抽样方案
SPSS暑期教师特训班 2
概概述述
距离测量方法
使用默认值即可
变量选择
无关变量有时会引起严重的错分
应当只引入在不同类间有显著差别的变量
尽量只使用相同类型的变量进行分析
SPSS暑期教师特训班 3
概概述述
共线性问题
对纪录聚类结果有较大的影响
最好先进行预处理
变量的标准化
变量变异程度相差非常大时需要进行
标准化后会削弱有用变量的作用
SPSS暑期教师特训班 4
概概述述
异常值
影响较大
还没有比较好的解决办法
尽力避免
分类数
从实用角度讲,2~8类比较合适
专业意义
一定要结合专业知识进行分析
SPSS暑期教师特训班 5
KK--meansmeans ClusterCluster过程过程
属于非系统聚类法的一种
方法原理
选择(或人为指定)某些观测作为凝聚点
按就近原则将其余观测向凝聚点凝集
计算出各个初始分类的中心位置(均值)
用计算出的中心位置重新进行聚类
如此反复循环,直到凝聚点位置收敛为止
SPSS暑期教师特训班 6
KK--meansmeans ClusterCluster过程过程
方法特点
要求已知类别数
可人为指定初始位置
节省运算时间
样本量大于100时有必要考虑
只能使用连续性变量
SPSS暑期教师特训班 7
KK--meansmeans ClusterCluster过程过程
分析实例
tear_res、gloss、opacity三个变量的取值将
20个样本分为三类
SPSS暑期教师特训班 8
KK--meansmeans ClusterCluster过程过程
分析实例
方差分析表
均数描述和均数图
SPSS暑期教师特训班 9
HierarchicalHierarchical ClusterCluster过程过程
属于系统聚类法的一种
方法原理
先将所有n个变量/观测看成不同的n类
然后将性质最接近(距离最近)的两类合并为一类
再从这n-1类中找到最接近的两类加以合并
依此类推,直到所有的变量/观测被合为一类
使用者再根据具体的问题和聚类结果来决定应当分
为几类
SPSS暑期教师特训班 10