文档介绍:模糊聚类分析方法
聚类分析是将事物根据一定的特征,并按某种特定要求或规律分类的方法。
由于聚类分析的对象必定是尚未分类的群体,而且现实的分类问题往往带有模糊
性,对带有模糊特征的事物进行聚类分析,分类过程中不是仅仅考虑事物之间有
无关系,而是考虑事物之间关系的深浅程度,显然用模糊数学的方法处理更为自
然,因此称为模糊聚类分析。
一、模糊聚类分析的一般步骤
1、第一步:数据标准化[9]
(1) 数据矩阵
设论域Uxxx {,12 ,L ,n }为被分类对象,每个对象又有 m 个指标表示其性状,
即
xiiiim {,xx12 ,,L x } (1,2,,)in L ,
于是,得到原始数据矩阵为
x11xx 12L 1m
x xxL
21 22 2m 。
MM M
xnn12xxL nm
其中 xnm 表示第 n 个分类对象的第 m 个指标的原始数据。
(2) 数据标准化
在实际问题中,不同的数据一般有不同的量纲,为了使不同的量纲也能进行
比较,通常需要对数据做适当的变换。但是,即使这样,得到的数据也不一定在
区间[0,1] 上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据
压缩到区间[0,1] 上。通常有以下几种变换:
① 平移·标准差变换
xik x k
xik (inkm 1,2,LL , ; 1,2, , )
sk
1 n 1 n
其中 , 2 。
xkik x sxxkikk()
n i1 n i1
经过变换后,每个变量的均值为 0,标准差为 1,且消除了量纲的影响。但
是,再用得到的 xik 还不一定在区间[0,1] 上。
② 平移·极差变换
xxik min{ ik }
1in
xik , (1,2,,)km L
max{xik } min{x ik }
1in 1in
显然有 01xik ,而且也消除了量纲的影响。
③ 对数变换