文档介绍:模糊聚类分析及算法比较
\.
竺竺兰
王花
.
黄晓霞
(上海海事大学信息工程学院,上海200135)
摘要:聚类分析方法有多种,其中的模糊聚类应用最为广泛。简单介绍模糊聚类的发展历程和模糊
聚类的几种常用算法。其中重点分析布尔矩阵法和最大树法两种模糊聚类分析算法,并用标准数据集对它们分剐进行聚类分析和比较。
关键词:模糊聚类;布尔矩阵法;最大树法
0引言
模糊聚类分析是依据客观事物间的特征、亲疏程
(1)自反性:1≤R(2)对称性:Rt=R
。。在1969年,。第一个系统地表述并研究了模糊聚类。、气
象分析、图像分割、模式识别、生物、医学诊断和化学分析等领域均时均取得了满意的效果和客观的效益。1
(3)传递性:R。R≤R则称R为模糊等价矩阵。
若R是模糊等价矩阵,则任意的入∈[0,1],R、是等价的布尔矩阵。当入在[0,1]上变动时,由R^得到不同的分类。2
模糊聚类分析
模糊聚类的步骤分为三步:数据标准化、建立模糊
相似矩阵聚类。其中聚类的方法有很多种,大致可分为模糊相似矩阵分类法和直接聚类法。本文具体研究基于模糊矩阵分类法中的布尔矩阵法和直接聚类法中的最大树法。
模糊相似矩阵和模糊等价矩阵的概念
如果X与Y都是有限集。则X到Y的模糊关系的
在介绍布尔矩阵法之前,先列出如下定理。
定理1f51:设R是论域U={X,,x:,…,x。}上相似的布
隶属函数值可用一个矩阵表示。设X={x,,x:,…,X。},Y={yl,Y2,…,Y。},R是X到Y的一个模糊关系,令rij=lx。x;,y,)(i=1,2,…,m;j=1,2,…,n),若所有元素满足rij∈[0,1],则称矩阵R=[rli]。为模糊矩阵。可知,布尔矩阵是模糊矩阵的特例。
若R满足自反性和对称性,则称R为模糊棚似矩
(当R是等价布尔矩阵时)甘
矩阵R在任一排列下的矩阵都没有形如:
【:三],【::],【::],【::】的特殊子矩阵。
布尔矩阵法的基本思想是,设R是论域U={xl,x2,…Ⅸ。}Ii的模糊相似矩阵,若要得到U的元素在入水平J:,显然R、是布尔矩阵,若R、为等价矩阵,则可以推出R也是等价矩阵。当然也可分类;若R。不是等价
阵。且对模糊相似矩阵R∈‰,对任意的k(自然数),
Rk也是模糊相似矩阵。
设论域U={x。,x2,…,)【n},R∈‰,I为单位矩阵,若R
满足:
收稿日期:2010—04—12
修稿日期:2010-04-22
作者简介:王花(1986一),女,安徽人,硕士,研究方向为港航与物流信息管理
@
万方数据
竺竺兰
/
矩阵,则可以把R、改变成一个等价的布尔矩阵,然后再进行分类。布尔矩阵法的具体步骤如下:
(1)首先求模糊相似矩阵的R、矩阵;
(2)按上面的定理l进行判断,若R、是等价的,则由R、可以得到U在入水平上的分类;若R、不是等价的,则按定理l判定为是等价的在某一排列下含有上述形式的特殊子矩阵。此时,只要将R、中上述形式的特殊子矩阵的“0”都改为“1”.直到不再产生上述形式的特殊子矩阵为止,如此得到的R’、为等价矩阵,则R‘.可以得到入水平上的分类。
。,在fO,11区间内为入取值,:设R是论域U={xI,X2'.”,Xn}上的模糊相似矩阵,先画出所有顶点Xi(i-l,2,…,n),在模糊矩阵R中按rii由大到小的顺序依
次画出树枝,并标上权重,要求不产生回路,直到所有
。3
算法比较
因为IRIS数据是国际公认的比较聚类方法效果好
坏的典型数据集,它包含了150个样本数据,总4维。。各类序号分别为:f1-50j,{51~100},{lOl~150)。=三类数据距离较近,并