文档介绍:第六章模糊聚类分析
普通分类(分类是硬性的,非此即彼)
一、集合的划分
对集合 X 的一个划分,是指把 X 分成若干个子集 X1,X2,…,Xn,使得满足下列二个条件:
① X1∪X2∪…∪Xn = X,且对i≠j ,
② Xi∩Xj = ,( i,j=1,2,…,n )
二、普通等价关系
设 R∈( X×X ),称 R 是 X 上一个等价关系,若 R 满足下列三个条件:
①自反性:x∈X,有( x,x )∈R ;
②对称性:x,y∈X,若( x,y )∈R,有( y,x )∈R ;
③传递性:x,y∈X,若( x,y )∈R,( y,z )∈R,有( x,z )∈R 。
例6-1 对集合(论域) X = {人} ,则关系 R = “年龄相同”就是 X 上的一个普通等价关系,
因为满足下列三个条件:
①自反性:任何人与自己是“年龄相同”的;
②对称性:我与你年龄相同,你与我年龄也相同;
③传递性:我与你年龄相同,你与他年龄相同,我与他年龄也相同。
三、普通分类
一个普通等价关系决定一个普通分类。
1
一、建立 X = { X1,X2,…,Xn } 上的模糊关系矩阵 R (叫标定)
其中 rij[0,1] ,表示元素 Xi 与 Xj 间的相似程度,i,j=,1,2,…,n,
模糊聚类(分类是有弹性的,亦此亦彼)
方法(一).评定打分法:
请专家或有经验的专业人员组成评定小组进行打分评定获得 rij 。
例:组成一个100人的评比小组,对X={X1,X2,X3}上的3个元素的相似性进行评价。结果是:
认为X1与X1“相似”的有100人,占100%,r11=1;认为X1与X2“相似”的有81人,占81%=1,r12=;
认为X1与X3“相似”的有53人,占53%,r13=;认为X2与X3“相似”的有24人,占24%,r23=;
此时r22=1,r33=1,r21=,r31=,r32=。从而X上的模糊关系矩阵为:
2
方法(二).统计指标法:
一个模糊等价关系决定一个模糊分类--- 叫聚类。
分类的集合 X = { X1,X2,…,Xn },由 n 个元素组成,
对其中每一个元素,采用不同的 m 个统计指标:
对元素 X1 ,采用统计指标 x1 = ( x11,x12,…,x1m ) ;
对元素 X2 ,采用统计指标 x2 = ( x21,x22,…,x2m ) ;
…………………………………………………
对元素 Xn ,采用统计指标 xn = ( xn1,xn2,…,xnm ) ;
( xij为第 i 个元素 Xi 的笫 j 项统计指标值)
将每个元素各项统计指标标准化:常用极值标准化公式
=
3
经过上步标准化后的 Xi 与 Xj 的各统计指标按下列方法中的任一种计算 rij 。
1. 欧氏距离法:
2. 数量积法:
其中 M 是个适当选择的常数,
3. 夹角余弦法:
4
4. 相关系数法:
5. 指数相似系数法:
其中 sk 是个适当的正常数
6. 最大最小法:
:
:
5
:
:
其中 M 是个适当的正常数,使得
0≤rij≤1
:
其中 C 是个适当的正常数,使得
0≤rij≤1
二、进行聚类
分模糊等价关系(矩阵)与模糊相似关系(矩阵)二种情况进行。
6
模糊等价关系(矩阵)与聚类分析
一、原理
因为: 模糊矩阵 R 是模糊等价矩阵对∈[0,1],R 的截矩阵 R均是
普通等价矩阵。
所以: 可通过 R对 X 上的元素进行聚类。
二、定理
若水平1, 2 满足 0≤1≤2≤1,则按2 分出的每一类必是按1 分出的一类的子类。
例6-2 设论域 X = { X1,X2,X3 ,X4,X5 },经过标定后得模糊关系矩阵为
易证 R 是 X 上的模糊等价矩阵,因此可从 R 出发对 X 中的元素进行模糊聚类。
解:方法(一):直接分类
7
②取 < ≤ ,得:
按该水平,r35=r53=1,
可将 X3,X5 归为一类,其余元素各自成一类,
共分成四类:
X = { X1 }∪{ X2 }∪{ X3 ,X5 }∪{ X4 }
③取 < ≤ ,得:
按该水平, r23= r32= r25= r52= r35=r53=1,
可将 X2,X3,X5 归为一类,其余元素各自成一类,
共分成三类:
X = { X1 }∪{ X2 ,X3,X5 }∪