1 / 2
文档名称:

主成分分析.doc

格式:doc   大小:19KB   页数:2页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析.doc

上传人:drp539605 2020/1/2 文件大小:19 KB

下载得到文件列表

主成分分析.doc

相关文档

文档介绍

文档介绍:3F1是X1X2…Xp的一切线性组合系数满足上述方程组中方差最大的F2是与F1不相关的X1X2…,Xp一切线性组合中方差最大的。依此类推Fp是F1F2…Fp-1与都不相关的X1,X2,…,Xp的一切线性组合中方差最大的。基于以上三条原则决定的综合变量F1F2…Fp-分别称为原始变量的第一、第二、…、第p个主成分。其中,各综合变量在总方差中所占的比重依次递减,在实际研究工作中,通常只挑选前几个方差最大的主成分,从而达到简化系统结构、抓住问题实质的目的。2主成分分析的计算步骤1将原始观察数据组成样本矩阵X,每一列为一个观察样本x,每一行代表一维数据2计算样本的协方差矩阵Cx3计算协方差矩阵Cx的特征值λi及相应特征向量ui其中i=12…p4将特征值按由大到小顺序排列,并按照下式计算前m个主成分的累积贡献率ηm=ni=1Σλi/ni=1Σi累积贡献率用于衡量新生主成分对原始数据的信息保存程度,通常要求其大于85%即可。5取前m个较大特征值对应的特征向量构成换矩阵TTTT=u1u2…umm<p6通过Y=TX计算前m个主成分,达到降低维数的目的3主成分分析在SPSS软件中的实现由于主成分分析法在数据降维方面的优势在实际问题中遇到指标较多且指标间相关关系较强时人们常考虑应用主成分分析的方法并且很多人选择了通过SPSS软件来实现该方法。但事实上目前用SPSS软件进行主成分分析的教材和发表的文章中有很多错误和误解之处。在SPSS软件中主成分分析法被看作是因子分析法的预备工作因此未将主成分分析计算结果单列出来这样虽然简化了程序却为主成分分析的计算稍稍带来了一些麻烦这是该软件的不足之处。因此在使用SPSS进行主成分分析时只能从因子分析的结果求出主成分分析模型的解。本文利用我国20~29年非农业人口占总人口的比重X1、城镇人口占总人口比重X2、人均GDPX3、第二产业的增加值比重X4、第三产业的增加值比重X5、城镇居民人均可支配收入X6、人均社会消费零售额X7、城镇居民人均居住面积X8为例说明如何利用因子分析模块得到主成分系数。首先对数据进行标准化处理以消除量纲的影响具体程序如下Analyze→DescriptiveStatistics→DescriptivesVariables框X1、X2、X3、X4、X5、X6、X7、X8√SavestandardizedasvariablesOK这样即可得到标准化变量ZX1、ZX2、ZX3、ZX4、ZX5、ZX6、ZX7、ZX8。接着执行如下操作Analyze→DataReduction→FactorVariables框ZX1、ZX2、ZX3、ZX4、ZX5、ZX6、ZX7、ZX8Descriptive√Coefficients√KMO的Bartlett'stestofsphericityContinueExtraction√ScreeplotContinueScores√Savingasvariable√DisplayfactorscorecoefficientmatrixContinueOK结果如表1~4所示。从表1可以看出KMO值为.827巴特利特球形检验的P值在95%的置信度下