1 / 12
文档名称:

主成分分析(精).doc

格式:doc   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析(精).doc

上传人:2768573384 2016/5/8 文件大小:0 KB

下载得到文件列表

主成分分析(精).doc

文档介绍

文档介绍:主成分分析实验 1 :数据 Employee 中为银行在 1969-1971 年之间雇员情况的数据,共包括 474 条观测及如下 10 各变量: ID, gender , Bdate, Educ, Jobcat ,Salary,Salbegin,Jobtime,Orevexp,Minority. 下面我们用主成分分析法处理该数据,一起用少数变量来描述该地区居民的雇佣情况。打开数据 Employee ,依次选分析——降维——因子分析点击 OK 即可,输出为: 公因子方差给出了该次分析从每个原始变量中提取的信息, 可看出除受教育程度信息损失较大外,主成分几乎包含了各个原始变量至少 90% 的信息。公因子方差初始提取 Educational Level (years) .754 Current Salary .896 Beginning Salary .916 Months since Hire .999 Previous Experience (months) .968 提取方法:主成份分析。解释的总方差显示了各主成分解释原始变量总方差的情况, 默认保留特征根大于 1 的主成分, 本例保留 3 个主成分,集中了原始 5 各变量信息的 % ,可见效果比较好。解释的总方差成份初始特征值提取平方和载入合计方差的% 累积% 合计方差的% 累积% 1 2 3 4 .365 5 .102 提取方法:主成份分析。实际上,主成分解释总方差的百分比也可以由公因子方差表计算得出,即( .754 + .896 + .916 + .999 + .968 ) /5=%, 成分矩阵给出了标准化原始变量用求得的主成分线性表示的近似表达式,以 current Salary 一行为例,用 prin1,prin2,prin3 来表示个各主成分,得到: 标准化的 Salary~*prin1+*prin2+(-02)*prin3. 成份矩阵 a 成份 123 Educational Level (years) .846 -.194 -.014 Current Salary .940 .104 .029 Beginning Salary .917 .264 -.077 Months since Hire .068 -.052 .996 Previous Experience (months) -.178 .965 .069 提取方法: 主成份。 a. 已提取了 3 个成份。在上面的主成分分析中, SPSS 默认是从相关矩阵出发求解主成分, 且默认保留特征根大于 1 的主成分,实际上,对主成分的个数,我们可以自己确定,方法为:选择“抽取——因子的固定数量”可以输入别的数值来改变 SPSS 软件保留特征根的大小。另外,还可以直接确定主成分个数。在实际进行主成分分析时可以先按照默认设置做一次主成分分析, 然后根据输出结果确定应保留主成分的个数,用该方法进行设定后重新分析。由成分矩阵中的结果可以得到: 2 2 2 2 2 ( 02) ( ) E ? ???????第一主成分的方差。又有 2 2 2 ( 02) E ? ???这恰好与公因子方差表中三个主成分提取 Salary 变量的信息相等, 重做一遍主成分, 此次将 5 个主成分全部保留, 得到成份矩阵 a 成份 12345 Educational Level (years) .846 -.194 -.014 .496 .008 Current Salary .940 .104 .029 -.234 .222 Beginning Salary .917 .264 -.077 -.183 -.225 Months since Hire .068 -.052 .996 -.013 -.026 Previous Experience (months) -.178 .965 .069 .174 .038 提取方法: 主成份。 a. 已提取了 5 个成份。对上表中结果有如下关系式: 2 2 2 2 2