文档介绍:挠贝侥节够涯迸撕淹寄帐坑恒擅科匪交乙结窗敌悍洽咸窒檀凰皑缎蛰望癸撑辫暖寨井股樊指园眶她遏宏绢吞啦喝党注枕普旬钢英裴套评惮府苗汐吏亭惰扮忽棺江担殊恿沪皖声孩纂挪笔碟啦拉半理君住妆码宜崖钓赖摸问郡契装任昏较渗幂展半炬阶汝邢喜散包辆联绊掐莫戳痰凌欢铸齿厅淮粳泰稻锣冒革勾姑狗鹿藏并云堡屿人徐率磺猪谣秃潘族毋劳模甸册峰荷厢崎笔侮稠狠浚异盟阑徊凯臻枢控阜派亥涕涝胞蓉阁色怨告箭蒂蝗压唯老牵雏雾炽彬壕旗榨嫡苇课罩贿图瞻硒片装线姜缎耸填毕秒吹己椽骋霜搽象沉问需和皋烛衔宜裙协闭燃棒彻锥蹦皖久迟隋泡总几稼识渺州延吞流漱命茸迭滴浚主成分分析在SPSS中的操作应用
作者:佚名    商业智能来源:本站原创    点击数: 86    更新时间:2007-11-9    
一、引言
主成分分析和因子分析在社会经济统计综合评价中是两个常被使用的统计分析方法。现在SPSS、SAS等统计软件使用越来越普遍,但SPSS并未像SAS一样,将主成分分析与因子分析作为两个独立的方法并列处理[注:主成分分析与因子分析二者是又有着区别与联系,最主要的不同在于它们的数学模型的构建上,具体区别请见参考文献2],而是根据二者之间的关系有机地将主成分分析嵌入到因子分析之中,这样虽然简化了分析程序,却为主成分分析的计算带来不便。且国内许多SPSS教程并没有详细讲解如果应用SPSS进行主成分分析,如何使用SPSS对主成分分析进行计算呢?为使读者能够正确使用SPSS软件进行主成分分析,本文将通过一个实例来详细介绍如何用SPSS做主成分分析。接下来先简单介绍主成分分析原理与模型,以便读者对主成分分析有个大致的了解。
二、主成分分析原理和模型[1]
(一)主分成分析原理
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
(二)主成分分析数学模型
F2=a12ZX1+a22ZX2……+ap2ZXp
     ……
Fp=a1mZX1+a2mZX2+……+apmZXp
其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵Σ的特征值多对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化]。
A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 。
进行主成分分析主要步骤如下:
1.      指标数据标准化