1 / 20
文档名称:

聚类分析的方法.docx

格式:docx   大小:175KB   页数:20页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析的方法.docx

上传人:mazhuangzi1 2022/8/14 文件大小:175 KB

下载得到文件列表

聚类分析的方法.docx

相关文档

文档介绍

文档介绍:聚类分析的方法
一、系统聚类法
系统聚类分析法就是利用一定的数学方法将样品或变量(所分析的项目)归并为若干不同的 类别(以分类树形图表示),使得每一类别内的所有个体之间具有较密切的关系,而各类别 之间的相互关系相对地比较疏远。系统聚类分距 离最近(关系最密切),应将它们归为一组,然后重复进行上述(1)、(2)、(3)步工 作。
以上各步重复进行n-1次则全部样品最后归并为一组,最后按归组的先后顺序及相应的 距离大小作出分类树形图。
(四)类别的划分
对于已建立的相似性矩阵,即可根据不同的且置信水平进行分类。分类时应先求出R的 入截矩阵。
7-38)
其中:
显然Rrij=1时,i与j应归为同一类,否则为不同类。对于不同的又,可得到不同的分类
方案,看0^^<1,则毘所分出的每一类必是兔的某一类的子类。
图7-3分类树形图左边的每一个分支代表一个成员,而右边的“根”则代表全部成员的总体。 由分支向根移动时,成员聚合成点群的程度愈来愈高。
以图7-3 为例,有5个原始成员,可能的点群有:五个点群,每个点群中成员之间的相 似程度最高(只有一个成员);4个点群,即成员(1、2)合并为一个点群,再加上余3 个成员;3个点群,即(1、2),(3、4),(5);两个点群,即(1、2),(3、4、5) 最后为一个点群,包括所有5 个成员。点群愈少,则点群中成员之间的相似程度愈差,这 就可以根据所研究问题的需要而选取。
运用Q式分类树形图进行地下水化学污染综合分类时,还应结合地区的水文地质条件分 析判断,才能达到较好的效果。
分 H
2 J :
: 根
J_L
: 划分点髀的朵相
I—似性水平
图 7-3 分类树形图
二、灰色聚类法
灰色聚类是将聚类对象对于不同聚类指数所拥有的白化数,按n个灰类进行归纳,判断该
聚类对象属于哪一类。灰色聚类可按下述步骤计算(邓聚龙, 1987):
一)确定灰类白化系数
若记I、II、III,…为聚类对象(即样品),1*、2*、3*,…为聚类指示(即评价因 子),1、2、3,…为聚类灰数(即等级划分),第i类聚类对象对第j个聚类指标所拥有 的白化数为(实测值),白化系数可按下式计
算:
7-39)
(k— 1, 2,…,n; j = 1,2,…,m)
二)求标定聚类权
7-40)
三)求聚类系数
第j个聚类对象对于第j个灰类的聚类系数为:
(7-41)
同理可得是个取样点几种污染因子的k个聚类系数矩阵。
(四)灰色聚类
取最大值为所对应的水质级别为该评价水体的水质级数。
三、模糊数学法
在评价地下水污染时,通常是按照污染物质的单项污染值及综合污染值来区分水质属于轻度 污染或严重污染。这样用一个污染指数值来判定污染程度,不能客观地反映出污染状况。按 模糊数学的观点,地下水污染评价中“污染程度”的界线是模糊的,对于这样的模糊问题应用 模糊数学方法把许多资料、判断及各种定性描述转化为模糊语言,对地下水污染进行综合识 别和判断,将会得到更为合理的解决。
(一)模糊聚类分析法
模糊聚类分析法就是根据各项污染指数得到的模糊矩阵作复合运算,得到模糊等价关系矩 阵,然后再进行模糊关系的分类。其基本步骤如下(蔡贻谟等,1987):
设分项污染值为禺(i=l, 2,
数据的标准化和正规化
n; j = 1, 2,…,m; n为样品数,m为监测的污染
物个数),则聚类因子值构成了一组nxm的原始数据阵叼)。对原始数据的标准化和正
规化处理方法可采用式7-32和式7-33。
模糊相容系数的计算
根据规一化数据计算出模糊相容系数矩阵,其作用在于找到样品间的相容性或差异性,以 便进行分类,相当于一般的聚类分析中确定分类尺度。计算的方法如第三节所述,可采用计 算相关系数R、相似系数S或计算欧氏距离D,以及计算斜交空间距离D1等,亦可按下式 计算距离关系补充定义的相容关系:
7-42)
第j个样品的第k个因子的值;
第i个样品与第j个样品的相容关系。
相容关系令越大,表示i, j两个样品污染状况越相似,反之差异越大。当衍=1时,说明 i, j 两个样品取样点的污染状况相同,属于同一类。
将计算得到的相容关系中作为矩阵元素,贝I」得到相容系数矩阵歇唧。
模糊矩阵复合运算
由以上具有模糊关系得到相容系数矩阵R, —般是满足反身性和对称性,不满足传递性, 不是模糊等价关系,直接由R不能有效地进行分类,需要对只作复合运算,得到模糊等价 关系矩阵。
设R是一个模糊关系(矩阵)。其具有反身性是指帀=1 (i、j = 1, 2,…,n);其具有
对称性是指$ = ■;其具有传递性是指对R进行复合运算,记只。只=丈,当取