文档介绍:关于主成份分析和因子分析实例
第一页,讲稿共六十三页哦
各个主成分分析是原始指标的线性组合
第二页,讲稿共六十三页哦
满足如下的条件:
主成分之间相互独立,即无重叠的信息。即
主成分的方差依次递减,重要性依次递减,即,讲稿共六十三页哦
■Rotation 按钮
第十六页,讲稿共六十三页哦
◘Method 选择旋转的方法。
►None 不进行旋转。
►Varimax 方差最大旋转。是一种正交旋转。它使得每个因子具有最高载荷的变量数最小。
►Direct Oblimin 直接斜交旋转。如果指定此项需要输入Delta值,越接近于0,斜交程度越深。
►Quartmax 四次最大正交旋转。
四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差达到最大。四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每个变量只在一个因子上又较高的载荷,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。
第十七页,讲稿共六十三页哦
►Equamax 平均正交旋转。是方差最大旋转和四次最大旋转的结合。可以使在一个因子上有较高载荷的变量数和变量中需要解释的因子数最少。
►Promax 斜交旋转方法。允许因子之间彼此相关,它比直接斜交旋转更快,因此适用于大数据集的因子分析。
◘Display
►Rotated solution 给出旋转后的因子载荷矩阵和因子转换矩阵。对于斜交旋转除显示以上两项外,还显示因子之间的相关矩阵。
第十八页,讲稿共六十三页哦
►Loding plots 因子载荷散点图。给出以因子为坐标
轴的各变量的载荷散点图。如果有两个因子,给出
原始变量旋转以后的散点图。如果多于三个因子,
则给出基于前三个因子的三维载荷散点图。如果只
提取一个因子则不会给出散点图。
■Scores 因子得分对话框。
◘Save as variable 将因子得分最为新变量保存在数据
文件中。
2
第十九页,讲稿共六十三页哦
◘Method 指定计算因子得分的方法。
►Regression 回归法。
►Bartlett 巴特利特法(加权最小二乘法)。
►Anderson-Rubin 安德森-鲁宾法。是为了保证因子的
正交性,而对Bartlett做的调整。因子得分的均值为0,
方差为1,且彼此不相关。
◘Display factor score coefficient matrix 显示因子得分
系数矩阵,是标准化的得分系数。
第二十页,讲稿共六十三页哦
■Options
2
第二十一页,讲稿共六十三页哦
◘ Sorted by size 载荷系数按其数值的大小排列并
构成因子载荷矩阵。使在同一个因子上具有较高
载荷的变量排在一起,便于观察。
◘Suppress absolute values less than 不显示那些绝
对值小于所指定值的载荷系数。输入0-1之间的数,
。选择此项可以突出载荷较大的变量,
便于得出结论。
第二十二页,讲稿共六十三页哦
Initial 列表示各变量的方差。
Extraction列表示每个变量被公共因子提取的方差,
即共同度。
因子分析结果
第二十三页,讲稿共六十三页哦
第二十四页,讲稿共六十三页哦
上表为未经旋转的因子载荷矩阵。
国内生产总值=*第一公因子+*第二公共因子
。。。。。。
第二十五页,讲稿共六十三页哦
再生相关矩阵:它是因子分析后的相关矩阵。即根据
各个变量的公共因子表达式所计算的变量之间的相关
系数矩阵。残差为原始相关矩阵与再生相关矩阵的差。
第二十六页,讲稿共六十三页哦
旋转后的因子载荷矩阵。相对于未旋转前因子载荷的
元素更加极端。
第二十七页,讲稿共六十三页哦
上表为因子旋转时的因子转换矩阵。
第二十八页,讲稿共六十三页哦
成分得分系数矩阵,上表给出了用原始变量表示主成份得分的系数信息。
标准化第一主成份(第一公因子)=*标准化后的国内生产总值
+……+*标准化后的城乡存款余额
第二十九页,讲稿共六十三页哦
未标准化第一主成份=*
*标准化后的国内生产总值+……+
* *标准化后的城乡存款余额
未标准化第二主成份=-*
*标准化后的国内生产总值+……+
0.016* *标准化后的城乡存款余额
第三十页,讲稿共六十三页哦
上表为因子得分的协方差矩阵,由此可见各个因子
之间是完全正交的。
第三十一页,讲稿共六十三页哦
例2: 用主成份分析研究影响我国物价波动的因素。受国内经济波动、居民收入及财富