文档介绍:2017-2-18 中国人民大学六西格玛质量管理研究中心 1多元统计分析何晓群中国人民大学出版社 2017-2-18 中国人民大学六西格玛质量管理研究中心 2第六章因子分分析目录上页下页返回结束?§ 因子分析的基本理论?§ 因子载荷的求解?§ 因子分析的步骤与逻辑框图?§ 因子分析的上机实现 2017-2-18 中国人民大学六西格玛质量管理研究中心 3第六章因子分分析目录上页下页返回结束因子分析( factor analysis )模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相对于主成分分析, 因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关矩阵。因子分析的思想始于1904 年 Charles Spearman 对学生考试成绩的研究。近年来, 随着电子计算机的高速发展,人们将因子分析的理论成功地应用于心理学、医学、气象、地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。本章主要介绍因子分析的基本理论及方法,运用因子分析方法分析实际问题的主要步骤及因子分析的上机实现等内容。 2017-2-18 中国人民大学六西格玛质量管理研究中心 4 目录上页下页返回结束§ 因子分析的基本理论§ 因子分析的基本思想§ 因子分析的基本理论及模型因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。在经济统计中,描述一种经济现象的指标可以有很多,比如要反映物价的变动情况,对各种商品的价格做全面调查固然可以达到目的,但这样做显然耗时耗力,为实际工作者所不取。实际上,某一类商品中很多商品的价格之间存在明显的相关性或相互依赖性,只要选择几种主要商品的价格或进而对这几种主要商品的价格进行综合,得到某一种假想的“综合商品”的价格,就足以反映某一类物价的变动情况,这里, “综合商品”的价格就是提取出来的因子。 2017-2-18 中国人民大学六西格玛质量管理研究中心 5 目录上页下页返回结束§ 因子分析的基本思想 2017-2-18 中国人民大学六西格玛质量管理研究中心 6 目录上页下页返回结束§ 因子分析的基本思想这样,对各类商品物价或仅对主要类别商品的物价进行类似分析然后加以综合,就可以反映出物价的整体变动情况。这一过程也就是从一些有错综复杂关系的经济现象中找出少数几个主要因子,每一个主要因子就代表经济变量间相互依赖的一种经济作用。抓住这些主要因子就可以帮助我们对复杂的经济问题进行分析和解释。因子分析还可用于对变量或样品的分类处理,我们在得出因子的表达式之后,就可以把原始变量的数据代入表达式得出因子得分值,根据因子得分在因子所构成的空间中把变量或样品点画出来,形象直观地达到分类的目的。因子分析不仅仅可以用来研究变量之间的相关关系,还可以用来研究样品之间的相关关系,通常将前者称之为 R 型因子分析, 后者称之为 Q 型因子分析。我们下面着重介绍型因子分析。 2017-2-18 中国人民大学六西格玛质量管理研究中心 7 目录上页下页返回结束§ 因子分析的基本理论及模型(一) Charles Spearman 提出因子分析时用到的例子为了对因子分析的基本理论有一个完整的认识,我们先给出 Charles Spearman 1904 年用到的例子。在该例中 Spearman 研究了 33名学生在古典语( C)、法语(F)、英语( E)、数学( M)、判别( D)和音乐( Mu )六门考试成绩之间的相关性并得到如下相关阵: 2017-2-18 中国人民大学六西格玛质量管理研究中心 8 目录上页下页返回结束§ 因子分析的基本理论及模型式中,为第门科目标准化后的考试成绩,均值为 0,方差为 1。为公共因子,对各科考试成绩均有影响,是均值为 0,方差为 1。为仅对第门科目考试成绩有影响的特殊因子, 与相互独立。也就是说,每一门科目的考试成绩都可以看作是由一个公共因子(可以认为是一般智力)与一个特殊因子的和。 Spearman 注意到上面相关阵中一个有趣的规律,这就是如果不考虑对角元素的话,任意两列的元素大致成比例,对 C列和 E列有: 51 .0 63 .0 54 .0 66 .0 64 .0