1 / 26
文档名称:

误差分析课件聚类分析之快速聚类法.ppt

格式:ppt   大小:5,283KB   页数:26页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

误差分析课件聚类分析之快速聚类法.ppt

上传人:文库新人 2022/2/12 文件大小:5.16 MB

下载得到文件列表

误差分析课件聚类分析之快速聚类法.ppt

文档介绍

文档介绍:误差分析课件聚类分析之快速聚类法
第1页,本讲稿共26页
要在
分析前对数据进行标准化处理。
5 方差加权距离
标准化数据
的欧氏距离就是方差加权距离。
第9页,本讲稿共26页
?
6 马氏距离
通常都是尝试各种不同距离分析,最终采用最有利于分类的距离定义。
[
]
å
å
=
=
-
=
-
-
-
=
-
-
=
-
n
i
i
T
n
i
i
i
n
j
i
T
j
i
j
i
x
n
x
x
x
x
x
n
S
x
x
x
S
x
x
S
x
x
x
x
d
1
1
2
1
2
1
1
1
)
)(
(
1
1
,
,
,
)
(
)
(
)
(
其中
算得的协方差矩阵:
是由样品
其中
L
第10页,本讲稿共26页

形成n个样品
两两之间的距离矩阵:
其中
第11页,本讲稿共26页
思想:首先将样品粗糙得分类,然后再依据样品间的距离按一定规则逐步调整,直至不能再调整为止。
适合于:样本数目较大的数据集的聚类分析
局限性:需要事先指定分类的数目,而且此数目对最终分类结果有较大影响。
解决办法:实际中一般要对多个分类的数目进行尝试,以找出合理的分类结果
快速聚类分析及实例
第12页,本讲稿共26页
1 选择聚点(聚类中心点)
经验选择
将n个样品人为地(或随机地)分为k类, 以每类的均值向量(称为重心)作为聚点。
最大最小原则
先选择所有样品中相距最远的两个样品为初始的两个聚点,然后,选择第3个聚点(与前两个聚点的距离最小者 ), 按相同的原则依次选取下去,直至选出k个聚点。
第13页,本讲稿共26页
(1)随机选择聚类种子点或中心点;
(2)将每个观察样本分配给最近的种子;
(3)重新把每个聚集中的中心点作为种子;
(4)不断重复上述过程直到种子的变化
足够小为止。
快速聚类法的步骤
第14页,本讲稿共26页
快速聚类法的步骤