文档介绍:以教材第五章习题8的数据为例,演示并说明主成分分析的详细步骤:
原始数据的输入
注意事项:关键注意设置好数据的类型(数值?字符串?等等)以及小数点后保留数字的个数即可。
1. 打开SPSS的“分析”→“降维”→“因子分析”,
打开“因子分析”对话框(如下图)
2. 把六个变量:食品、衣着、燃料、住房、交通和通讯、娱乐教育文化输入到右边的待分析变量框。
3. 设置分析的统计量
打开最右上角的“描述”对话框,选中“统计量”里面的“原始分析结果”和“相关矩阵”里面的“系数”。(选中原始分析结果,SPSS自动把原始数据标准差标准化,但不显示出来;选中系数,会显示相关系数矩阵。)。然后点击“继续”。
打开第二个的“抽取”对话框:“方法”里选取“主成分”;“分析”、“输出”和“抽取”这三项都选中各自的第一个选项即可。然后点击“继续”。
第三个的“旋转”对话框里,选取默认的也是第一个选项“无”。
第四个“得分”对话框中,选中“保存为变量”的“回归”;以及“显示因子得分系数矩阵”。
第五个“选项”对话框,默认即可。
这时点击“确定”,进行主成分分析。
按照SPSS输出结果的先后顺序逐个介绍
:是6个变量两两之间相关系数大小的方阵。
:
给出了这次主成分分析从原始变量中提取的信息,可以看出交通和通讯最多,而娱乐教育文化损失率最大。
Communalities
Initial
Extraction
食品
.878
衣着
.825
燃料
.841
住房
.810
交通和通讯
.919
娱乐教育文化
.584
:
系统默认方差大于1的为主成分,所以只取前两个,%。,。
Total Variance Explained
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
1
2
3
.600
4
.359
5
.142
6
.043
.712
Extraction Method: ponent Analysis.
4. 主成分载荷矩阵:
Component Matrixa
Component
1
2
交通和通讯
.925
-.252
食品
.902
.255
衣着
.880
-.224
住房
.878
-.195
娱乐教育文化
.588
.488
燃料
.093
.912
应该特别注意:
这个主成分载荷矩阵并不是主成分的特征向量,也就是说并不是主成分1和主成分2的系数,主成分系数的求法是:各自主成分载荷向量除以各自主成分特征值的算术平方根。那么第1主成分的各个系数是向量(, , , , , )除以后得到,即(, , , , , )(这才是主成分1的特征向量,满足条件:系数的平方和等于1),分别乘以6个原始变量标准化之后的变量即为第1主成分的函数表达式:
同理可以求出第2主成分的函数表达式。(同学们自己求解!)
5. 主成分得分系数矩阵
Component Score Coefficient Matrix
Component
1
2
食品
.253
.198
衣着
.247
-.174
燃料
.026
.708
住房
.246
-.152
交通和通讯
.259
-.196
娱乐教育文化
.165
.379
该矩阵是主成分载荷矩阵除以各自的方差得来的,实际上是因子分析中各个因子的系数,在主成分分析中可以不考虑它。
6. 因子得分
在步骤二中,第四个“得分”对话框中,我们选中“保存为变量”的“回归”;以及“显示因子得分系数矩阵”。SPSS的输出结果和原始数据一起