1 / 21
文档名称:

SPSS 因子分析和主成分分析.doc

格式:doc   大小:525KB   页数:21页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SPSS 因子分析和主成分分析.doc

上传人:中华文库小当家 2020/5/17 文件大小:525 KB

下载得到文件列表

SPSS 因子分析和主成分分析.doc

相关文档

文档介绍

文档介绍:实验课:因子剖析实验目理解主成分(因子)剖析基本原理,熟悉并掌握SPSS中主成分(因子)剖析方法及其主要应用。因子剖析基础理论知识1概念因子剖析(Factoranalysis):就是用少数几个因子来描述许多指标或因素之间联系,以较少几个因子来反映原资料大部分信息统计学剖析方法。从数学角度来看,主成分剖析是一种化繁为简降维处理技术。主成分剖析(ponentanalysis):是因子剖析一个特例,是使用最多因子提取方法。它通过坐标变换手段,将原有多个相关变量,做线性变化,转换为另外一组不相关变量。选取前面几个方差最大主成分,这样达到了因子剖析较少变量个数目,同时又能与较少变量反映原有变量绝大部分信息。两者关系:主成分剖析(PCA)与因子剖析(FA)是两种把变量维数降低以便于描述、理解与剖析方法,而实际上主成分剖析可以说是因子剖析一个特例。2特点(1)因子变量数量远少于原有指标变量数量,因而对因子变量剖析能够减少剖析中工作量。(2)因子变量不是对原始变量取舍,而是根据原始变量信息进行重新组构,它能够反映原有变量大部分信息。(3)因子变量之间不存在显著线性相关关系,对变量剖析比较方便,但原始部分变量之间多存在较显著相关关系。(4)因子变量具有命名解释性,即该变量是对某些原始变量信息综合与反映。在保证数据信息丢失最少原则下,对高维变量空间进行降维处理(即通过因子剖析或主成分剖析)。显然,在一个低维空间解释系统要比在高维系统容易多。3类型根据研究对象不同,把因子剖析分为R型与Q型两种。当研究对象是变量时,属于R型因子剖析;当研究对象是样品时,属于Q型因子剖析。但有因子剖析方法兼有R型与Q型因子剖析一些特点,如因子剖析中对应剖析方法,有学者称之为双重型因子剖析,以示与其他两类区别。4剖析原理假定:有n个地理样本,每个样本共有p个变量,构成一个n×p阶地理数据矩阵:当p较大时,在p维空间中考察问题比较麻烦。这就需要进行降维处理,即用较少几个综合指标代替原来指标,而且使这些综合指标既能尽量多地反映原来指标所反映信息,同时它们之间又是彼此独立。线性组合:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标(主成分),则其线性组合为:Lij是原变量在各主成分上载荷无论是哪一种因子剖析方法,其相应因子解都不是唯一,主因子解仅仅是无数因子解中之一。zi与zj相互无关;z1是x1,x2,…,xp一切线性组合中方差最大者,z2是与z1不相关x1,x2,…所有线性组合中方差最大者。则,新变量指标z1,z2,…分别称为原变量指标第一,第二,…主成分。Z为因子变量或公共因子,可以理解为在高维空间中互相垂直m个坐标轴。主成分剖析实质就是确定原来变量xj(j=1,2,…,p)在各主成分zi(i=1,2,…,m)上荷载lij。从数学上容易知道,从数学上也可以证明,它们分别是相关矩阵m个较大特征值所对应特征向量。(第一步)因子剖析是从众多原始变量中重构少数几个具有代表意义因子变量过程。其潜在要求:原有变量之间要具有比较强相关性。因此,因子剖析需要先进行相关剖析,计算原始变量之间相关系数矩阵。如果相关系数矩阵在进行统计检验时,,则这些原始变量就不太适合进行因子剖析。进行原始变量相关剖析之前,需要对输入原始数据进行标准化计算(一般采用标准差标准化方法,标准化后数据均值为0,方差为1)。SPSS在因子剖析中还提供了几种判定是否适合因子剖析检验方法。主要有以下3种:巴特利特球形检验(BartlettTestofSphericity)反映象相关矩阵检验(Anti-imagecorrelationmatrix)KMO(Kaiser-Meyer-Olkin)检验(1)巴特利特球形检验该检验以变量相关系数矩阵作为出发点,它零假设H0为相关系数矩阵是一个单位阵,即相关系数矩阵对角线上所有元素都为1,而所有非对角线上元素都为0,也即原始变量两两之间不相关。巴特利特球形检验统计量是根据相关系数矩阵行列式得到。如果该值较大,且其对应相伴概率值小于用户指定显著性水平,那么就应拒绝零假设H0,认为相关系数不可能是单位阵,也即原始变量间存在相关性。(2)反映象相关矩阵检验该检验以变量偏相关系数矩阵作为出发点,将偏相关系数矩阵每个元素取反,得到反映象相关矩阵。偏相关系数是在控制了其他变量影响条件下计算出来相关系数,如果变量之间存在较多重叠影响,那么偏相关系数就会较小,这些变量越适合进行因子剖析。(3)KMO(Kaiser-Meyer-Olkin)检验该检验统计量用于比较变量之间简单相关与偏相关系数。KMO值介于0-1,越接近1,表明所有变量之间简单相关系数平方与远大于偏相关系数平方