文档介绍:第二章
因素分析
(Factor Analysis)
我们在上一章谈到「主成份分析」,它的目的是希望用较少的变量去解释原始数据的大部分变异。而这些变量也就是我们利用主成份分析法整理而得的总体性指标。在这一章里,我们将要介绍的因素分析法,也是希望能够降低变量的数目,但不同的是我们是想在一群具有相关性且难以解释的资料中, 找出几个概念上有意羲的,并且彼此之间近于独立的可以影响原始数据的共同因素。
第一节 何谓因素分析法
底下我们以九个变量为例子,由图2-1我们可约略看出因素分析的要义。在九个变量中,可能某几个变量在表面上看来即很相似,亦即其彼此间之相关系数较高,而事实上会影响这些变量观察值结果的很可能是其背后看不到的某些共同原因所造成的。因此我们知道,可借着因素分析法,由九个彼此相关的变量中萃取出其背后真正影响结果的三个主要因素:
Factor 1 是四个变量的共同因素
Factor 2 是二个变量的共同因素
21
Factor 3 是三个变量的共同因素。
图2-1
我们可以回想做过的一些心理或性向测验(因素分析是计量心理学的重要工具之一),这些测验的问卷题目,很多都是彼此相关的问题, 而主试者可以在回收问卷数据后将数据加以整理分析,找出背后有那些共同因素影响受试者的答案。可能是受试者的保守性会直接影响他们对堕胎问题、两性关系的看法;或者是自信心影响了他们在处理人际关系,面对困难的态度。这些事情的后面,我们希望能用某些因素(factors)来表现出来。
主成份分析所着重的在于如何「转换」原始变项使之成为一些综合性的新指标,而其关键在「变异数」问题。与主成份分析不同的是,因素分析重视的是如何解释变量之间的「共变异数」
(covariance)问题,因每一位受试者的反应变量均为一些「共同因素变量 (common factor variate)」和「唯一因素变量 (unique factor variate)」的线性函数。例如,若我们能找出,使得:
()
则就叫做「共同因素」,而为变量的「唯一因素」,为变量的「唯一因素」,等等。
上面的式子有一点像回归的写法,而也像是模型中的误差项。但不同的是,在做因素析时,我们通常已将标准化,因此()中,是没有截矩项的。习惯上,我们希望互相正交,但这并不是非要不可的要求。在计算的技巧上,我们常喜欢首先试一下恰好是的情形。这也是为甚么一些软件往往将主成分分析和因素分析放在一起的原因之一。
其中「共同因素变量」可产生反应变项之间的共变量(它们在标准化以后时, 即为相关系数),而唯一性变量部分则只对其所属的变项之变异数有所贡献,所以主成份分析是「变异数」导向的方法,因素分析则是「共变异数」导向的方法。
在技术层面上,若给定一个p×p的共变异矩阵或者相关矩阵,则我们通常只能求出一组p个主成分出来。这一部分是直接计算就可以得到的。但因素的求得,就有很多方法。先利用主成分分析作最初的探索只是其中较常用的一种。Statistica提供了六种不同的如何萃取因素的方法,后面会提到。
第二节 模式
我们将主成分分析和因素分析的模式写在下面以作比较。对于主成分分析,它的主成分的形式是
我们这里不写出误差项来,是因为若是给定了原始数据,则, 通通是靠纯粹的计算就可以完全求得的。这里没有甚么模型上的误差。在因素分析里,我们要设法找到等因素,使得
这里,我们是在「建立模型」,虽然做法上和我们常做的利用回归分析来建模的不一样,但「利用一试再试,以达到一个令人满意的模型」的基本想法却是一样的。因此在这里我们会有误差顶存在。上面的两个形式里,,为原始资料的反应变项,为第个共同因素在第个变项下的重要性,一般叫做共同因素负荷量(common factor loading),有时,我们会省去「共同」(common),而只说因素负荷(factor loading)。而为共同因素(common factors),为第个唯一因素变量(unique factor)。若以矩阵的形式表示,则为
它们的假设前题是:
共同因素变量之间互为独立,平均数为0,变异数1。
之间也互相独立,平均数为0,变异数为(
为「唯一性变异数 (unique variance)」。
第三节 因素分析法之步骤
因素分析法之步骤如下:
选择所欲分析的变量
准备相关矩阵,估计共同性
决定因素的数目
从相关矩阵中抽取共同因素
旋转因素,增加变项与因素之间关系的解释
结果解释
这些步骤,大部分可由软件都可替你做好。但最主要的6,却是要使用者自行依照他或她的专业判断来执行。
Statistica是从相关系数的矩阵(意思是说,它的对角线