文档介绍:维普资讯
门
,;,/
第卷第期湖南地质.
】年月
模糊聚类分析及其地质应用实例
鹰塑
湖南省地质矿产局测绘队衡阳
摘要聚类分析直接利用相似矩阵或相关矩阵来分类,但它们本身存在矛盾,分类时也
会出现矛盾。为消除这个矛盾,可采用模糊聚类分析。它的特点是,通过相似矩阵连续白乘,改
造成模糊分类矩阵,随后按不同要求进行分类。本文旨在介绍模糊聚类分析的步骤和方法,井提
供一个一袖珍机模糊聚类分析源程序。附两个算侧。
关键词聚糙类搁分析啜相孙似矩阵模糊关系矩阵模糊分类矩阵,
. 陵雩. 、侣茛
聚类分析及其矛盾』、
聚类分析,是一种对事物进行科学分类的数学方法。地质学中的分类问题,例如矿物分
类、岩石分类、地层分类、化石分类、化验标本分类等等,都是一项重要的基础研究。其分
类方法有简单、复杂之分。简单的分类方法,例如按颜色、比重、硬度等作为分类标准,不
必借助于数学方法但当事物性质复杂, 样品很多,且分类依据又很多的时候,分类就不那
么一目了然。这时应用聚类分析, 便能较台理方便的解决分类问题。
按问题的性质, 聚类分析归纳为两大类, 即型和型聚类分析。型是对变量进行分
类,变量包括化学分析结果的各个元素,表示性质的代码、化学成份等。型是对样品进行
分类。样品包括地段岩体、钻孔标本等等。
聚类分析就是将性质相似的变量, 或特性相似的样品,按亲疏关系,划分为不同类别,并
以聚类图谱系图表示之””。聚类分析的步骤是·
设有个样品,每个样品有个变量的测定数据如化验结果等,将它们排列成一
个×的数表, 数据为.。
为消除变量间不同量纲的影响将各样品同一变量的数据标准化。其中极差标准化
公式为:
苹㈩
一∑
为第个变量的,的平均数。—』———~
: ,,⋯⋯,,⋯⋯
对于型聚类分析,计算样品之间的距离,且转化为相似系数若把每个样品看
成是维空间的~个点,则、两个样品之间的距离,定义为:
、柏南省地质矿产局情报图书中心教学地质学习资料.
维普资讯
湖南地质第卷
『.—”
取时,称为欧儿里德距离
样品间的相似系数
—
其中是全部距离中的最大距离。至此构成了×阶相似系数矩阵。它表示样品之
间的相似程度。本点对本点的表示本点与本点完全相似。若.,于是理解为、
一
两个样品相厝似程度达% ,如此等等。
一一
对于型聚类分析,计算变量之间的相关系数:
圭一一写
一——厂:———:—:—:二:■:—:—:—::—:—:—:—兰—:::
/∑—· ∑】—
至此构成了× 阶相关距阵。相关系数在、一之间,分别表示变量间正相关和
负相关,且表示相关的程度。
根据相似矩阵或相关矩阵作出分类判别,有两个方法:一为一次形成法, 即直接由
相似矩阵系数作出判别,依的大小, 一次性划出那些、为同一类;二为逐步形成法,在
判别的大小之后,对其他作某种变换,计算新的,再往下判别。
最后绘出聚类图,且作专业解释。上述过程说明,这种分类的正确性,取决于相似
矩阵或相关矩阵本身的正确性。如果相似矩阵本身有矛盾,则用它作