1 / 12
文档名称:

第七章 聚类分析.doc

格式:doc   大小:264KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第七章 聚类分析.doc

上传人:zbfc1172 2019/2/4 文件大小:264 KB

下载得到文件列表

第七章 聚类分析.doc

文档介绍

文档介绍:§1 系统聚类法(I)一、距离系数聚类分析是研究“物以类聚”的一种统计方法,通常以“距离”和“相似系数”为依据来进行聚类。本节以“距离”为依据的有最短距离法、最长距离法及中间距离法等聚类方法。设有n个样品,每个样品测定m个指标,其数据矩阵为:计算点Xi与点Xj间的距离公式有:(1)绝对值距离(2)欧氏距离(3)明氏距离①即绝对值距离②即欧氏距离二、聚类步骤(1)将n个样品各自成一类;(2)计算样品间的距离,将距离最近的两个样品并成一类;(3)计算新类与其余各类的距离,再将距离最近的两类合并,重复上述步骤直到所有样品归成一类为止。三、聚类方法(最短距离法、最长距离法、中间距离法)类与类之间的距离有许多定义的方法,就产生不同的聚类方法,以下用dij表示样品Xi与Xj间的距离,用Dij表示类Gi与Gj间的距离。首先介绍最短距离法、最长距离法及中间距离法。(1)(2)若,则新类Gr与其它各类Gk间距离:(1)(2)、例题a例1 已知5个大豆品种及一个指标(荚数/株),试用最短距离法聚类,其观测数据如表x1x2x3x4x5荚数/:采用表1D0G1G2G3G4G5G1={x1}0G2={x2}={x3}={x4}={x5}={x1,x2}G3={x3}G4={x4}G5={x5}G6={x1,x2}0G3={x3}={x4}={x5}={x1,x2}G3={x3}G7={x4,x5}G6={x1,x2}0G3={x3}={x4,x5}={x1,x2}G8={x4,x5,x3}G6={x1,x2}0G8={x4,x5,x3}{x1,x2},{x3},{x4},{x5}{x1,x2},{x3},{x4,x5}{x1,x2},{x3,x4,x5}{x1,x2,x3,x4,x5}(谱系图)例2 已知七个小麦品种及三个指标,试用最短距离法聚类,其观测数据如表:单产(公斤/亩)穗粒数(粒)千粒重(克):(1)数据模型,取对数lgx(2)计算品种间距离采用欧氏距离公式: (3)逐步聚类表1:D0G1G2G3G4G5G6G7G1={x1}0G2={x2}={x3}={x4}={x5}={x6}={x7}:D1G1={x1}G2={x2}G3={x3}G8={}G6={x6}G7={x7}={}:D2G1G2G3G9={}={}:D3G10={x1,2}G3G9={}G6G10={x1,2}={}:D4G11={x1,2,4,5,7}G3G6G11={x1,2,4,5,7}:D5G12={x1,2,4,5,7,6}G3G12={x1,2,4,5,7,6}{x1},{x2},{x3}