1 / 30
文档名称:

spss___因子分析和主成分分析.doc

格式:doc   页数:30页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

spss___因子分析和主成分分析.doc

上传人:sanshengyuanting 2016/7/11 文件大小:0 KB

下载得到文件列表

spss___因子分析和主成分分析.doc

相关文档

文档介绍

文档介绍:实验课:因子分析实验目的理解主成分(因子)分析的基本原理,熟悉并掌握 SPSS 中的主成分(因子) 分析方法及其主要应用。因子分析一、基础理论知识 1概念因子分析( Factor analysis ) :就是用少数几个因子来描述许多指标或因素之间的联系, 以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看, 主成分分析是一种化繁为简的降维处理技术。主成分分析( ponent analysis ) :是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段, 将原有的多个相关变量, 做线性变化, 转换为另外一组不相关的变量。选取前面几个方差最大的主成分, 这样达到了因子分析较少变量个数的目的, 同时又能与较少的变量反映原有变量的绝大部分的信息。两者关系: 主成分分析( PCA ) 和因子分析( FA ) 是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。 2特点(1 )因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。(2 )因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。(3 )因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。(4 )因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。在保证数据信息丢失最少的原则下, 对高维变量空间进行降维处理( 即通过因子分析或主成分分析) 。显然,在一个低维空间解释系统要比在高维系统容易的多。 3类型根据研究对象的不同,把因子分析分为R 型和 Q 型两种。当研究对象是变量时,属于 R 型因子分析; 当研究对象是样品时,属于 Q 型因子分析。但有的因子分析方法兼有 R 型和 Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 4 分析原理假定:有 n 个地理样本,每个样本共有 p 个变量,构成一个 n×p 阶的地理数据矩阵: 当p 较大时,在p 维空间中考察问题比较麻烦。这就需要进行降维处理, 即用较少几个综合指标代替原来指标,而且使这些综合指标既能尽量多地反映原来指标所反映的信息,同时它们之间又是彼此独立的。线性组合:记 x1, x2,…, xP 为原变量指标, z1, z2,…, zm (m≤p) 为新变量指标(主成分) ,则其线性组合为: Lij 是原变量在各主成分上的载荷无论是哪一种因子分析方法, 其相应的因子解都不是唯一的, 主因子解仅仅是无数因子解中之一。 zi与 zj 相互无关; z1是 x1, x2,…, xp 的一切线性组合中方差最大者, z2 是与 z1 不相关的 x1, x2,…的所有线性组合中方差最大者。则,新变量指标 z1, z2,…分别称为原变量指标的第一,第二,…主成分。 Z 为因子变量或公共因子,可以理解为在高维空间中互相垂直的 m 个坐标轴。主成分分析实质就是确定原来变量 xj( j=1 ,2,…,p) 在各主成分 zi( i=1 ,2,…,m) 上的荷载 lij。从数学上容易知道,从数学上也可以证明,它们分别是相关矩阵的 m 个较大的特征值??????????????? np nn p pxxx xxx xxxX??????? 21 222 21 112 11??????????????????? p mp mmm pp ppxlxlxlz xlxlxlz xlxlxlz???? 2211 2222 121 2 1212 1 11 1??????????????????? p mp mmm pp ppxlxlxlz xlxlxlz xlxlxlz???? 2211 2222 121 2 1212 1 11 1 所对应的特征向量。 5 分析步骤 确定待分析的原有若干变量是否适合进行因子分析( 第一步) 因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程。其潜在的要求: 原有变量之间要具有比较强的相关性。因此, 因子分析需要先进行相关分析, 计算原始变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验时, 大部分相关系数均小于 且未通过检验,则这些原始变量就不太适合进行因子分析。进行原始变量的相关分析之前, 需要对输入的原始数据进行标准化计算( 一般采用标准差标准化方法,标准化后的数据均值为 0 ,方差为 1)。 SPSS 在因子分析中还提供了几种判定是否适合因子分析的检验方法。主要有以下 3种: 巴特利特球形检验( Bartlett Test of Sphericity ) 反映象相关矩阵检验( Anti-image correlation