1 / 9
文档名称:

第十章--聚类分析.ppt

格式:ppt   大小:201KB   页数:9页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第十章--聚类分析.ppt

上传人:文库旗舰店 2020/10/29 文件大小:201 KB

下载得到文件列表

第十章--聚类分析.ppt

相关文档

文档介绍

文档介绍:第七章聚类分析聚类分析(ClusterAnalysis)是研究“物以类聚”的一种方法,国内有人称它为群分析、点群分析、簇群分析等。人类认识世界往往首先将被认识的对象进行分类,因此分类学便成为人类认识世界的基础科学。聚类分析是研究分类问题的一种多元统计方法,本章将由聚类分析的基本概念开始,重点介绍系统聚类方法及其在社会、经济研究中的应用。§、聚类分析的基本思想二、系统聚类法的步骤一、聚类分析的基本思想认为所研究的对象(样品或指标)之间存在着不同的相似性。根据对象的多个观测指标,具体找出一些能够度量它们之间相似程度的统计量,以此为划分类型的依据,把一些相似程度较大的对象聚合为一类,把另外一些彼此之间相似程度较大的对象又聚合为另一类,关系亲密的聚合到一个小的分类单位,关系疏远的聚合到一个大分类单位,直到把所有对象都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。最后再把整个分类系统化成一张普系图,用它把所有对象间的亲疏关系表现出来。二、系统聚类法的步骤系统聚类法(HierarchicalClusteringMethod)是目前国内外使用的最多的一种方法,有关它的研究极为丰富。它包含以下步骤:(1)计算n个样品两两间的距离,记作D=;(2)构造n个类,每个类只包含一个样品;二、系统聚类法的步骤(3)合并距离最近的两类为一新类;(4)计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3);(5)画聚类图;(6)决定类的个数和类。§、测量尺度二、距离三、相关系数一、。指标由连续的实值变量表示。如长度、重量、经济统计数字等。。该指标没有明确的数量关系,只有次序关系,如产品质量可分为一等品、二等品、三等品等三种等级。。具有该种特性的变量在度量时既没有数量表示,也没有次序关系。如性别分为男和女,市场供求中的产和销,医疗诊断中的阴性和阳性等。二、距离用表示第i个样品的第j个指标,用表示第i个样品与第j个样品之间的距离,一般要求距离满足四个条件:ⅰ),对于一切i和j;ⅱ)=0,等价于样品与样品的各指标相同;ⅲ)=,对于一切,;ⅳ),对于一切,,。