1 / 32
文档名称:

系统聚类的方法.ppt

格式:ppt   大小:2,058KB   页数:32页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

系统聚类的方法.ppt

上传人:mh900965 2017/5/16 文件大小:2.01 MB

下载得到文件列表

系统聚类的方法.ppt

相关文档

文档介绍

文档介绍:聚类分析?1聚类分析一聚类分析的定义二系统聚类的基本思想三八种系统聚类方法四类间距离的统一性?一、聚类分析的定义?“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。因此,分类学已成为人们认识世界的一门基础科学。?聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和 R型聚类。 Q型聚类是对样品进行分类处理, R型聚类是对变量进行分类处理。?二、系统聚类的基本思想?系统聚类的基本思想是:距离相近的样品( 或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。?系统聚类法是诸聚类分析方法中使用最多的一种,按下列步骤进行: ?计算 n个样品两两之间的距离,构成距离矩阵?合并距离最近的两类为一新类?计算新类与当前各类的距离。再合并、计算,直至只有一类为止?画聚类图,解释?将n个样品各作为一类?三、八种系统聚类方法?在进行系统聚类之前,我们首先要定义类与类之间的距离,由类间距离定义的不同产生了不同的系统聚类法。常用的类间距离定义有 8种之多,与之相应的系统聚类法也有 8种,分别为最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法。它们的归类步骤基本上是一致的,主要差异是类间距离的计算方法不同。以下用 dij 表示样品 Xi与 Xj之间距离,用 Dij 表示类 Gi 与 Gj之间的距离。? 1. 最短距离法?定义类与之间的距离为两类最近样品的距离,即为??(1) ?设类与合并成一个新类记为,则任一类与的距离为??(2) ?最短距离法进行聚类分析的步骤如下: ?(1)定义样品之间距离,计算样品的两两距离,得一距离?阵记为 D(0),开始每个样品自成一类,显然这时 Dij = ? dij 。?(2)找出距离最小元素,设为 Dpq ,则将 Gp 和 Gq 合并成一个?新类,记为 Gr ,即 Gr = { Gp , Gq }。?(3)按( )计算新类与其它类的距离。?(4)重复( 2)、( 3)两步,直到所有元素。并成一类为?止。如果某一步距离最小的元素不止一个,则对应这些?最小元素的类可以同时合并。? 1. 最短距离法?【例 1】设有六个样品,每个只测量一个指标,分别是 1,2,5,7,9, 10 ,试用最短距离法将它们分类。?(1)样品采用绝对值距离,计算样品间的距离阵 D(0),见表 1?表 1 ? 1. 最短距离法?(2)D(0)中最小的元素是 D12 = D56 =1,于是将 G1 和 G2 合?并成 G7 , G5 和 G6 合并成 G8 ,并利用( )式计算新类与其?它类的距离 D(1),见表 2 ?表 2 ? 1. 最短距离法?(3)在 D(1)中最小值是 D34 = D48 =2 ,由于 G4 与 G3 合并, ?又与 G8 合并,因此 G3 、 G4 、 G8 合并成一个新类 G9 ,其与其?它类的距离 D(2),见表 3 ?表 3 ? 1. 最短距离法