文档介绍:主成分分析与因子分析方法的比较
The Comparison of Principal Component Analysis Method and Factor
Analysis Method
内容摘要:主成分分析和因子分析都是简化数据结构的重要方法,二者既有区别也有联系。 二者都町以运用SPSS软件求解分析,同时,主成分分析还可以应用matlab软件编程求解。文章 首先从概念上介绍这两种方法,说明两种方法的原理;同时,通过这两种方法对安徽省15个县 的经济发展的指标数据进行实证分析和比较,在两种模型的建立与求解过程中,不同方法得到的 排名结果不同。再结合两种方法的原理及应用的区别,就四个方面具体比较两种方法。分析比较 之后,得出明显的结论:两种方法的排名结果差别比较大,这对于建立完善的评估体系是无益的, 对于经济社会的发展起不到应有的作用。因此,熟悉两种方法的区别,并判别不同问题的使用方 法,才能在实际应用时选择更实用更合理的方法,对经济现象进行更有效的分析和评价。
关键词:主成分分析;因子分析;SPSS; matlab;经济发展
主成分分析与因子分析方法的比较 1
引言 1
1
2国内研究成果 1
3 本文研究思路 2
主成分分析与因子分析原理 2
1主成分分析原理 2
2 因子分析原理 3
实证分析 4
1数据准备 4
2主成分分析 4
3因子分析 6
结论 8
1结果分析 8
9
结束语 10
参考文献 错误!未定义书签。
附录1 错误!未定义书签。
附录2 错误!未定义书签。
附录3 错误!未定义书签。
附录4 错误!未定义书签。
引言
在分析省内几个地区的发展状况时,为了尽可能全面反映评价对彖的整体情况, 需要选取恰当的、客观的评价指标。由于数据的复杂性,综合评价通常涉及到多指 标,这不仅会增加评价的工作量而且会因评价指标间的相关性造成评价信息相互干 扰,从而难以客观地反映评价对象的真实属性。
在实际工作中,需要精简指标,将原来的指标重新组合成一组相互无关的综合指 标以此来尽可能多地反映原来指标信息量,主成分分析与因子分析为解决此类问题提 供了很好的方法。
主成分分析和因子分析都是简化数据结构的重要方法,二者既有区别也有联系。 主成分分析方法是一种将多维因子纳入同一系统进行定性、定量化研究,理论比较完 善的多元统计分析方法。研究如何通过少数几个主成分来解释多变量的方差、协方差 结构的分析方法,也就是求出少数几个主成分,使它们尽可能多地保留原始变量的信 息,且彼此不相关。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成 少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方 法。这两种方法是处理多变量、大样本时经常采用的方法,其二者的最终目的都是降 维。
但这两种综合评价方法往往易混淆,因此比较两种分析方法的异同点对于解决问 题有重要作用。
主成分分析方法和因子分析方法都是寻求从高维空间到低维空间的映射的方法, 国内文献中就其区别研究,主要分为以下几种:统计依据、数学模型、计算方法、综 合指标的选取等方面比较它们的异同①,以理论的分析具体理解两种分析方法。
另外,国内文献中,也从主成分分析法、因子分析法的基本思想、使用方法及统
①钱道翠:《综合评价主成分分析方法与囚子分析方法的比较》,浙江:浙江统计,2004年,第32页。 计量的分析等多角度进行比较,并辅以实例分析研究气
本文给出选出的安徽省内15个县的经济指标数据,由于指标过多,并可能存在共 线性问题,考虑利用主成分分析方法和因子分析方法进行比较综合评价。
以实际数据建立模型求解分析,运用matlab软件实现主城分析建模求解,运用spss 软件分析因子分析的结果,在建模求解、结果分析的过程中比较两种评价方法的特点。
主成分分析与因子分析原理
主成分分析法①是一种降维的统计方法,它借助于一个正交变换,将其分量相关 的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的 协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之 指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以 一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系 统转化成一维系统。
设Xi,X2,…,Xp为实际问题的p个n维随机变量(p项指标)记X = (Xl,X2,--,Xp), 其协方差矩阵为
E 二(0几二 E[(X -E(X))(X - E(X)门
它