文档介绍:模糊数学方法及其应用
论文题目:模糊聚类方法案例分析
小组成员:
王季光宋申辉兰洁
陈倩芸肖仑杨洋
吴云峰
2013年10月27日
模糊聚类分析方法
距离和相似系数
为了将样品(或指标)进行分类,就需要研究样品之间矩阵,
称为F相似矩阵。在实际应用时,通常只能得到自反矩阵和对称举证,即相似矩阵。现在的问题是对具有相似关系的元素怎样进行分类,也就是如何将相似矩阵改造为等价矩阵。
定理
若RtR,则称R为对称矩阵。(1)
若R1(I是单位矩阵),则称R为自反矩阵。(2)
——2
若RR,则称R为传递的F关系。(3)
若满足上面三点则称为等价矩阵。
定理1:相似矩阵RUnn的传递闭包是等价矩阵,且RRn。
证只需要证明R是自反的、对称的。
n
2ruRkRn।
因R是自反的,故R1,RR。不难得到Rn不减,因此k1:
即R是自反的。
因为rrt,(RT(RYRn,故R是对称的。
有定理1可见,要想将相似矩阵改变为等价矩阵,只需求相似矩阵的传递闭包。
定理2:设RUnn是自反矩阵,则任意自然数mn,者B有
RRm
证由R自反性推得
RR2...Rn...
当mn时,有
RRnRmURkRk1
所谓聚类分析,就是用数学的方法对事物进行分类,它有广泛的实际应
用。在模糊数学产生之前,聚类分析已是数理统计多元分析的一个分支,然而现
实的分类问题往往伴有模糊性。例如,环境污染分类、春天连阴雨预报、临床症状资料分类、岩石分类,等等。对这些伴有模糊性的聚类问题,用模糊数学语言来表达更为自然。
模糊聚类分析的步骤:
第一步:数据标准化
数据矩阵
设论域U{Xl,X2,Lxn}为被分类的对象,每个对象由m个指标表示其性状,
即
Xi(X1,Xi2,...,Km)
于是得到原始数据矩阵为
X11
X12
L
Xm
X21
X22
L
X2m
M
M
M
Xn1
Xn2
L
Xnm
数据标准化
在实际问题中,不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进行比较,通常需要对数据作适当的变换。但是,即使这样,得到的数据也不一定在区间[0,1]上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。
通常需要作如下集中变换。
1)平移?标准差变换
2)平移?极差变换
3)对数变换
第二步标定(建立模糊相似矩阵)
设U(U1,U2,,4}为待分类的全体。其中每一待分类对象由一组数据表征如
下:
Ui(Xi1,Xi2,...,Xim)
现在的问题是如何建立“和山之间的相似关系。这有许多方法(这里选一些,
列在下面),我们可以按照实际情况,选其中一种来求口与5的相似关系
R(U,Uj)「j
(1)形似系数法数量积法
1
rj1m
M㈠
其中M为一适当选择之正数,满足
m
Mmax(Xk-Xjk)
hjk1
夹角余弦法
m
m
IxikxillXjkxjI
k1
rij'm-2
.(XikXi)2.
.k1
m
(Xj
Xj)2
其中
最大最小法
ml
-11
,XjmJ
r
rj
m
min(Xi」Xjk)k1