1 / 58
文档名称:

聚类分析 (2)2.ppt

格式:ppt   大小:3,928KB   页数:58页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析 (2)2.ppt

上传人:文库新人 2021/11/30 文件大小:3.84 MB

下载得到文件列表

聚类分析 (2)2.ppt

相关文档

文档介绍

文档介绍:聚类分析
*
第一页,课件共58页
引言
地质学中有很多分类研究的问题,如沉积岩、古生物、矿物、油气藏、油气地球化学勘探指标的分类等是一些直接分类的例子;油气资源评价、油源对比等研究中也有分类;地层划分属于另一种分类。为叙述方便,在此把分类的具体目标统称为个体(样品或变量)。
聚类分析:根据个体之间的亲疏程度,将它们进行逐级定量分类的一种多元统计分析方法。
根据分类的不同方式,又把聚类分析分为聚合法和分解法聚类分析。
*
第二页,课件共58页
§1 聚类分析和聚类统计量
一、聚类分析
1
2
5
4
6
7
3
8
9
10
11
13
12
14

















图6-1 油气化探指标聚类谱系图
(1,2,…,14为化探指标编号)
引例:化探指标的分类
如某地区油气地表化探样品具有14项指标,按照指标相关程度分类,结果如图。类内指标具有密切的成因联系,据此可以化简研究系统。
参照上例,给出聚合法聚类分析的一般概念。
1. 聚合法聚类分析
*
第三页,课件共58页
聚合法聚类分析是按个体在性质或成因上的亲疏关系,把个体逐级聚集成类的一种多元统计分析方法。又称为点群分析,
对样品进行分类—称Q型聚类分析
对变量进行分类—称R型聚类分析
这种聚类分析开始时,每个个体各自为一类,然后以某种表示个体亲疏关系的统计量为分类依据,把彼此关系相对密切的个体合并为小类,再把关系相对密切的小类进一步合并,…,最后直到合并成一个大类为止。最终得到一个反映各对象间亲疏关系的分类结果 — 聚类分析谱系图,如图6-1。
*
第四页,课件共58页
例如{1 1 2 2 3 3}是6个个体,据个体的相似性,把个体分为3类,结果是:{1 1}、{2 2}、{3 3}。这是一种把大类分解成小类的问题,地层的岩性段划分属于这类问题。
2. 分解法聚类分析
这种聚类方法与聚合法“方向”恰好相反,开始时全部个体为1大类,依据某种分类指标,把全部个体分为2类、3类、…, 直到满足分类的要求为止。
二、聚类分析统计量
衡量个体间性质或成因亲疏(相似、相关)程度的统计指标。
*
第五页,课件共58页
1. 聚合法聚类统计量
设有n个样品,每个样品有m个变量,它们的观测值xij (i =1 , 2 ,…, n ; j =1 , 2 ,…, m)构成一个数据矩阵,记为:
第i行是第i个样品m个变量的观测值,可视为m 维空间的一个点或一个矢量;
由 Xn×m可以看出:
分类
对象
几个常用的聚类分析统计量:
*
第六页,课件共58页
样品间的相似性就是矩阵行间的相似性,对样品聚类就是将矩阵中相似程度高的行合并为类;
变量间的相关性就是矩阵列间的相关性,对变量聚类就是将矩阵中相关程度高的列合并为类。
(1) Q型聚类分析统计量
相似系数
设样品观测值:
第j 列是第j个变量的n次观测值,可视为n维空间的一个点或一个矢量;
*
第七页,课件共58页
(6-1)
如此,可形成一个相似系数矩阵R=[rij]n×n 。
将Xi与Xj看成两个矢量,则Xi与Xj的相似系数定义为两矢量夹角的余弦:
*
第八页,课件共58页
在上述相似系数矩阵中, rij =rji , rii=1。rij 越接近1,Xi与Xj的性质越相近。R描述了各样品间的相似程度。
*
第九页,课件共58页
(6-2)
矢量Xi与Xj的相关系数为:
相关系数
如此可形成一个相关系数矩阵R=[rij]n×n 。
在相关系数矩阵中: rij =rji , rii=1。rij越接近1,Xi与Xj的相关程度越大。
*
第十页,课件共58页