1 / 54
文档名称:

统计分析-聚类分析.ppt

格式:ppt   大小:509KB   页数:54页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

统计分析-聚类分析.ppt

上传人:相惜 2021/2/8 文件大小:509 KB

下载得到文件列表

统计分析-聚类分析.ppt

文档介绍

文档介绍:§10 聚类分析(Cluster Analysis)
[引例10-1]
1
编辑ppt
§10 聚类分析(Cluster Analysis)
[引例10-1]
2
编辑ppt
§10 聚类分析(Cluster Analysis)
§ 概述
§ 统计量
§ 系统聚类(层次聚类)
§ 快速聚类
3
编辑ppt
§ 概述
问题的提出
基本思想
主要步骤
基本原则
主要分类
§ 概述
4
编辑ppt
§ 概述
问题的提出
聚类分析又称群分析、点群分析、簇群分析等,是研究分类问题(样本或指标)的一种多元统计方法。
与其它多元统计分析方法相比,聚类分析方法比较粗糙,理论上尚不完善,目前正处于发展阶段。
但由于这种方法能解决许多实际问题,应用比较方便,因此越来越受到人们的重视。
5
编辑ppt
§ 概述
问题的提出
6
编辑ppt
基本思想
假定研究对象之间存在不同程度的相似性(亲疏程度)。
根据观测样本,找出并计算一些能够度量相似程度的统计量(相似系数、相关系数、距离等)。
按照相似性统计量,将相似程度大的聚合到一类,关系疏远的聚合到另一类,直到把所有样本都聚合完毕,形成一个由小到大的分类系统。
最后将分类系统直观地用
图形表示出来,即谱系图。
§ 概述
7
编辑ppt
主要分类
R型聚类分析
对变量进行聚类分析(比较:主成分、公因子)
Q型聚类分析
对样本进行聚类分析(比较:主成分得分、因子得分)
§ 概述
8
编辑ppt
主要分类
系统聚类(hierarchical cluster)
不指定最终的类数,结论将在聚类过程中寻求,这种聚类称为系统聚类
可以对变量和样本进行聚类分析
快速聚类(K-means cluster)
事先指定用于聚类分析的类数
只对样本进行聚类分析,适合大样本数据
§ 概述
9
编辑ppt
统计量
为了将样本(或变量)进行分类,需要研究其关系。
目前用得最多的方法有两个:一种方法是用相似系数,比较相似的样本归为一类,不怎么相似的样本归为不同的类。
另一种方法是将一个样本看作P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类。
对样本进行聚类(Q型聚类),常用的统计量为距离;
对变量进行聚类(R 型聚类),常用的统计量为相似系数。
§ 统计量
10
编辑ppt