文档介绍:第十章因子分析
10-1   因子分析概述
因子分析是将多个实测变量转换为少数几个不相关的综合指标的一种多元统计技术,在这里,称所转换成的几个不相关的综合指标为因子。
例如,有人对体育运动项目10项全能所包含的10个项目的得分进行分析,结果发现100米跑、400米跑、跳远三个项目的得分高度相关,它们构成速度因子;铅球、铁饼、标枪三个项目的得分也高度相关,它们构成爆发性臂力因子;跳高、百米栏、撑杆跳及跳远四个项目的得分相关性也较高,它们构成爆发性腿力因子;1500米跑的得分与其它项目的得分相关性较小,独自构成耐力因子。
10-1-1 因子分析的数学模型
为了解中学生的知识和能力,选了100名学生,每人答40个题,问题包括的面很广,回答这些问题需要多方面的能力,这些能力可归结为语文水平、数学推导能力、艺术修养、历史知识、生活常识等五个方面,每个方面称为一个公因子,学生每道题的得分主要由这五个公因子确定。
可以设想学生第i题的分数xi(i=1,2,3…40)可表示为上述五个因子的线性函数:
xi =μi+Li1 f1+ Li2 f2+ Li3 f3+ Li4 f4+ Li5 f5+εi (i=1,2,…40)
其中f1 ,f2 ,f3 ,f4 ,f5 表示5个因子,其系数Lij 叫因子载荷,表示第i个题目的得分可以用这5个因子方面的能力来表述的程度;μi 是总平均;εi 是第i个题目的得分不能被这5个因子包括的部分,叫特殊因子。
以上就是一个最简单的因子模型,细心的读者也许已经发现,这个模型与回归分析模型在形式上很相似,但这里从f1 ,f2 ,f3 ,f4 ,f5代表什么,到模型中应该包含几个因子都是未知的,有关参数的意义也不相同。
因子分析的首要任务就是要估计模型中因子fj的个数及其系数Lij ,然后给每个因子fj一个合理的解释。若难以找到合理的解释,需进一步作因子旋转,以便旋转后得到合理的解释。
把以上简单因子模型推广到一般情况,得到因子分析的一般模型:
设有P个相关的可观测的指标,记为 x1 ,x2 ,x3 ,…xp ; m个不可观测的相互独立的公因子,记为 f1 ,f2 ,f3 ,…fm 。每个指标xi 可由这m个公因子及一个特殊因子来描述,即
x1 =μ1+L11 f1+ L12 f2+ L13 f3+ …+ L1m fm+ε1
x2 =μ2+L21 f1+ L22 f2+ L23 f3+ …+ L2m fm+ε2
…………
xp =μp+Lp1 f1+ Lp2 f2+ Lp3 f3+ …+ Lpm fm+εp
记
称L为因子载荷矩阵
以上就是因子分析的数学模型。
10-1-2 因子分析模型中各统计量的意义
的统计意义
因子载荷Lij 就是第i个变量与第j个因子的相关系数。,变量xi是公共因子f1 ,f2 ,f3 ,…fm及特殊因子εi的线性组合,系数Li1 ,Li2 …Lim 用于度量变量xi可用公因子f1 ,f2 ,f3 ,…fm线性表示的程度,系数Li1 ,Li2 …Lim 叫做“权”,表示变量xi依赖于公因子fj(j=1,2,…m)的程度,称Lij是第i个变量在第j个因子上的载荷,它反映了第i个变量xi在第j个因子fj上的相对重要性。Lij越大,表示变量xi对公因子fj越重要。
)的统计意义
因子载荷矩阵L中第i行元素的平方和称为第i个变量xi的共同度(也叫公共方差),记为hi2,即
hi2=Li12+ Li22+ Li32+…+ Lim2
变量xi的共同度hi2代表m个公因子共同对第i个变量xi方差的贡献。
变量xi的方差由两部分组成,第一部分就是其共同度hi2,第二部分是由特殊因子对第i个变量xi方差的贡献称为特殊方差,或特殊度,记为σi2, 第i个变量xi的共同度hi2 与特殊度σi2间有如下关系:
hi2+σi2=1
在因子载荷矩阵L中,第j列元素的平方和称为第j个因子fj的因子贡献,记为Sj2(其中J=1,2,…m),即
Sj2= L1j2+ L2j2+ L3j2+…+ Lpj2 (j=1,2,3,…m)
Sj2的统计意义与变量xi的公同度hi2的统计意义恰好相反,Sj2表示第j个公因子fj 对于所有变量x1 ,x2 ,x3 ,…xp的总影响,称为公共因子fj 对所有变量的总贡献。Sj2是公因子fj 对每一个变量x1 ,x2 ,x3 ,…xp所提供的方差之和,它是衡量公因子相对重要性的度量。
10-2   因子分析实例
例10-1   对10项全能运动所含的10个项目得分间的关系进行研究,现测得100名10项全能运动员各项目成绩的得分(原始数据略),对这10个项目进行因子分析,提取4个