1 / 67
文档名称:

聚类分析及matlab实现.ppt

格式:ppt   大小:504KB   页数:67页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析及matlab实现.ppt

上传人:1485173816 2021/6/10 文件大小:504 KB

下载得到文件列表

聚类分析及matlab实现.ppt

文档介绍

文档介绍:聚类分析及MATLAB实现
聚类分析及MATLAB实现聚类分析及MATLAB实现统计方法(聚类分析):聚类分析—所研究的样本或者变量之间存在程度不同的相似性,要求设法找出一些能够度量它们之间相似程度的统计量作为分类的依据,再利用这些量将样本或者变量进行分类
系统聚类分析—将n个样本或者n个指标看成n类,一类包括一个样本或者指标,然后将性质最接近的两类合并成为一个新类,依此类推。最终可以按照需要来决定分多少类,每类有多少样本(指标)
由于本人工作能力和接触项目有限,希望借此机会将自己的体会与大家分享,更希望大家能提出更多更为深刻的意见! 谢谢
统计方法(聚类分析):
聚类分析—所研究的样本或者变量之间存在程度不同的相似性,要求设法找出一些能够度量它们之间相似程度的统计量作为分类的依据,再利用这些量将样本或者变量进行分类
系统聚类分析—将n个样本或者n个指标看成n类,一类包括一个样本或者指标,然后将性质最接近的两类合并成为一个新类,依此类推。最终可以按照需要来决定分多少类,每类有多少样本(指标)
统计方法(系统聚类分析步骤):
系统聚类方法步骤:
计算n个样本两两之间的距离
构成n个类,每类只包含一个样品
合并距离最近的两类为一个新类
计算新类与当前各类的距离(新类与当前类的距离等于当前类与组合类中包含的类的距离最小值),若类的个数等于1,转5,否则转3
画聚类图
决定类的个数和类。
系统聚类分析:
主要介绍系统聚类分析方法。系统聚类法是聚类分析中应用最为广泛的一种方法,它的基本原理是:首先将一定数量的样品或指标各自看成一类,然后根据样品(或指标)的亲疏程度,将亲疏程度最高的两类进行合并。然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,直至将所有的样品(或指标)合并为一类。
系统聚类分析用到的函数:
函 数
功 能
pdist
计算观测量两两之间的距离
squareform
将距离矩阵从上三角形式转换为方形形式,或从方形形式转换为上三角形式
linkage
创建系统聚类树
dendrogram
输出冰柱图
cophenet
计算Cophenetic相关系数
cluster
根据linkage函数的输出创建分类
clusterdata
根据数据创建分类
inconsistent
计算聚类树的不连续系数
聚类分析
研究对样品或指标进行分类的一种多元统计方法,是依据研究对象的个体的特征进行分类的方法。
聚类分析把分类对象按一定规则分成若干类,这些类非事先给定的,而是根据数据特征确定的。在同一类中这些对象在某种意义上趋向于彼此相似,而在不同类中趋向于不相似。
职能是建立一种能按照样品或变量的相似程度进行分类的方法。
聚类分析有两种:一种是对样品的分类,称为Q型,另一种是对变量(指标)的分类,称为R型。
R型聚类分析的主要作用:
⒈不但可以了解个别变量之间的亲疏程度,而且可以了解各个变量组合之间的亲疏程度。
⒉根据变量的分类结果以及它们之间的关系,可以选择主要变量进行Q型聚类分析或回归分析。(R2为选择标准)
Q型聚类分析的主要作用:
⒈可以综合利用多个变量的信息对样本进行分析。
⒉分类结果直观,聚类谱系图清楚地表现数值分类结果。
⒊聚类分析所得到的结果比传统分类方法更细致、全面、合理。
在课堂上主要讨论Q型聚类分析, Q型聚类常用的统计量是距离.
样品(变量)间相近性度量
聚类分析的基本思想
在生产实际中经常遇到给产品等级进行分类的问题,如一等品、二等品等,在生物学中,要根据生物的特征进行分类;在考古时要对古生物化石进行科学分类;在球类比赛中经常要对各球队进行分组如何确定种子队,这些问题就是聚类分析问题。随着科学技术的发展,我们利用已知数据首先提取数据特征,然后借助计算机依据这些特征进行分类,聚类的依据在于各类别之间的接近程度如何计量,通常采取距离与相似系数进行衡量。
设有n个样品的p元观测数据组成一个数据矩阵
其中每一行表示一个样品,每一列表示一个指标,xij表示第i个样品关于第j项指标的观测值,聚类分析的基本思想就是在样品之间定义距离,在指标之间定义相似系数,样品之间距离表明样品之间的相似度,指标之间的相似系数刻画指标之间的相似度。将样品(或变量)按相似度的大小逐一归类,关系密切的聚集到较小的一类,关系疏远的聚集到较大的一类,聚类分析通常有:谱系聚类、快速聚类,我们主要介绍谱系聚类的方法与MATLAB实现