1 / 7
文档名称:

第五章 聚类分析.docx

格式:docx   大小:81KB   页数:7页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第五章 聚类分析.docx

上传人:jiyudian11 2022/6/9 文件大小:81 KB

下载得到文件列表

第五章 聚类分析.docx

相关文档

文档介绍

文档介绍:
判别分析,即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有 n 个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体) 中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,
具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为 对象进行聚类,其结果作为K—均值法确定类数的参考。

K 均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。系统聚类对不同的类 数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定, 有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K均值法确定类数的 参考。
有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用X , X ,…,X
(1) (2) (n )
表示n个有序的样品,则每一类必须是这样的形式,即X , X ,…,X ,其中1 < i < n,
(i) (i+D (j)
且j < n ,简记为G = {i,i +1, , j}。在同一类中的样品是次序相邻的。一般的步骤是(1)
i
计算直径{D (i,j) }。(2)计算最小分类损失函数{L[p(l,k)]}。⑶确定分类个数k。(4)最优分 类。

( 1)用最短距离法进行聚类分析。
采用绝对值距离,计算样品间距离阵
10
210
5 4 3 0
8 7 6 3 0
10 9 8 5 2 0
由上表易知中最小元素是 于是将,,聚为一类,记为
计算距离阵
0
30
6 3 0
8 5 2 0
中最小元素是=2于是将,聚为一类,记为
计算样本距离阵
0
30
6 3 0
中最小元素是于是将,聚为一类,记为
因此,
G 4-1
二附
1

( 2)用重心法进行聚类分析 计算样品间平方距离阵
4
1
0
25
16
9
0
64 49 36 9 0
100 81 64 25 4 0
易知中最小兀素是于是将,,聚为一类,记为
计算距离阵
0
16 0
49 9 0
81 25 4 0
注:计算方法,其他以此类推。
中最小兀素是=4 于是将,聚为一类,记为
计算样本距离阵
0
16
0
64
16
0
中最小兀素是 于是将,聚为一类,记为 因此,
采用系统聚类分析结果如下:
便用平均联接(组间)笛树状图
由树状图可以看到,如果分为两类,则第9 个地区即上海为一类,其他地区为一类;若分为 三类,则9 为一类,1 和 11即北京和浙江为一类,其他地区为一类。以此类推。
K 均值聚类分析结果如下:
聚类
乍成员
案例号
x7
聚类
距离
1
北京
1

2
天津
1

3
河北
3

4
山西
3

5
内蒙古
3

6
辽宁
1

7
吉林
1

8
黑龙江
3

9
上海
2
.000
10
江苏
1

11
浙江
1