文档介绍:题目:下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K- 均值法分别对这些公司进行聚类,并对结果进行比较分析。
角军:令净资产收益率为X1,每股净利润X2,总资产周转率为X3,资产负债率为X4,流动负债比 率为X5,每股净资产为X6,净利润增长率为X7,总资产增长率为X8,用spss对公司聚类分析的步 骤如下:
a)系统聚类法:
Classify Hierachical Cluster,调出系统聚类分析主界 面, 并将变量X8-X1移入Variables框中。在Cluster栏中选择Cases单选按钮,即对样品进 行聚类(若 选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复 选框,这样在结果 输出窗口中可以同时得到聚类结果统计量和统计图。
2•点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。我们选择Agglomeration schedule 与 Cluster Membership 中的 Range of solution 2-4,如图 所示,点 击 Continue 按 钮,返回主界面。 (其中,Agglomeration schedule表示在结果中给出聚类过
程表,显示系统聚类的详细步骤; Proximity matrix表示输出各个体之间的距离矩阵; Cluster
Membership表示在结果中输出一个表,表中显示每个个体被分配到的类别, Range of
solution 2-4即将所有个体分为 2至4类。)
,设置结果输出窗口中给出的聚类分析统计图。选中 Dendrogram复选框 和Icicle栏中的None单选按钮,,即只给出聚类树形图,而不给出 冰柱图。单击
Continue按钮,返回主界面。
蠹 Hinrarchicdl CILrst»r Analyte 应 d
,schecMe
"oxftymalfY
Clustef Member stMp
CanCTi
Statistics子对话框
Plots子对话框
4•点击Method按钮,设置系统聚类的方法选项。 Cluster Method下拉列表用于指定 聚类的
方法,这里选择Between-group inkage (组间平均数连接距离); Measure栏用于选择对距 离和相似性的测度方法,选择Squared Euclidean distanee (欧氏距离);单击Continue按钮,返 回主界面。
S HlfrjrchkilClwrtff Arulysit: bffthod
finery
rli 6
qpngegp
to ()A1 r«ngc-
Save子对话框
「WWW* 1
Ortm- Ctficql
Method子对话框
5•点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新变量。 None表示不保
存任何新变量;Single solution表示生成一个分类变量,在其后的矩形框中输入要分成的类 数;Range of solutions表示生成多个分类变量。这里我们选择 Range of solutions,并在后面 的两个矩形框中分别输入 2和4,即生成三个新的分类变量,分别表明将样品分为 2类、3 类和4类时的聚类结果,。点击Continue,返回主界面。
6•点击0K按钮,运行系统聚类过程。
聚类结果分析:
下面的群集成员表给出了把公司分为 2类,3类,4类时各个样本所属类别的情况,另外,
从右边的树形图也可以直观地看到, 若将15个公司分为2类,则13独自为一类,其余的为
一类;若分为3类,则公司8分离出来,自成一类。以此类推。
Cluster Membership
Case
4 Clusters
3 Clusters
2 Clusters
1
1
1
1
2
1
1
1
3
1
1
1
4
1
1
1
5
2
1
1
6
1
1
1
7
1
1
1
9
1
1
1
10
1
1
1
11
1
1
1
12
1
1
1
13
4
3
2
14
1
1
1
15
1
1
1
HiERARCHlCALcLUSTER
>#>###*************
Dendrogram using Average Linkage (B