文档介绍:案例--聚类分析
2
我国各地区城镇居民消费性支出的聚类分析
刘肖 A31114042
一、问题的背景
下表列出了1999年全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民家庭平均每人
案例--聚类分析
2
我国各地区城镇居民消费性支出的聚类分析
刘肖 A31114042
一、问题的背景
下表列出了1999年全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民家庭平均每人全年消费性支出的八个主要变量数据。这八个变量是
:食品
:交通和通讯
:衣着
:娱乐教育文化服务
:家庭设备用品及服务
:居住
:医疗保健
:杂项商品和服务
消费性支出数据 单位:元
地区
北京
天津
河北
山西
内蒙古
辽宁
吉林
3
4
12
3
4
10
9
13
13
3
17
12
11
14
14
3
16
13
0
16
15
12
24
0
0
17
16
3
22
14
0
17
17
3
12
16
15
18
18
3
27
17
0
19
19
3
10
18
0
20
20
3
25
19
0
21
21
3
14
20
0
23
22
13
20
0
0
24
23
2
3
0
21
24
24
2
13
23
22
25
25
2
21
24
0
26
26
2
11
25
0
27
27
1
2
0
26
28
28
1
9
27
0
29
29
1
26
28
0
30
30
1
19
29
0
0
5
聚类进度表,上图显示了变量的聚类过程。在步骤一,,这一类的下次聚类合并是在步骤二。在首次出现阶群集中,0表示非类聚类,1表示同类聚类。
6
上图为树状图。从以上图中可得分为两类或三类最为合适。
8
以下用matlab软件进行聚类分析
1:数据的读取与标准化
首先将数据保存至excel文件中
[data,textdata]=xlsread(‘’);
data=zscore(data)
2:一步聚类
直接利用clusterdata函数进行一步聚类,其命令与结果如下
obslabel=textdata(2:end,1);
Taverage=clusterdata(data,'linkage','average','maxclust',3);
obslabel(Taverage==1)
obslabel(Taverage==2)
obslabel(Taverage==3)
8