1 / 17
文档名称:

第八讲 主成分分析和因子分析.ppt

格式:ppt   大小:986KB   页数:17页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第八讲 主成分分析和因子分析.ppt

上传人:卓小妹 2022/8/17 文件大小:986 KB

下载得到文件列表

第八讲 主成分分析和因子分析.ppt

文档介绍

文档介绍:第八讲 主成分分析和因子分析
第1页,共17页,2022年,5月20日,3点42分,星期一
变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息的基础,降低维度,将原来的多个变量组合成相互独立的少数的、新的综合变量。
变第八讲 主成分分析和因子分析
第1页,共17页,2022年,5月20日,3点42分,星期一
变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息的基础,降低维度,将原来的多个变量组合成相互独立的少数的、新的综合变量。
变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。

因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。

第2页,共17页,2022年,5月20日,3点42分,星期一
二、主成分分析 1、基本原理
统计信息实际上是指数据变异信息
右图中,在椭圆的长轴方向数据变异明显大于短轴方向
第3页,共17页,2022年,5月20日,3点42分,星期一
F1
F2
F1与F2不相关
沿长、短轴方向设定新坐标系,长轴变量承载大部分变异信息,短轴变量承载少量变异信息.
一个长轴新变量F1就可以代表原来两个变量的主要信息,从而起到降维作用
在主成分分析中,提取出的每个新变量(主成分)都是原来多个变量的线性组合
第4页,共17页,2022年,5月20日,3点42分,星期一
如由两个原始变量X1和X2,可提取两个主成分:
  F1 =a11X1 +a21X2
  F2 =a12X 1 +a22X2
依次类推:由N个原始变量可提取N个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义.
一般情况下按贡献率由大到小,取累计贡献率达到85%的前2~3个主成分,其他的忽略不计。
在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。
第5页,共17页,2022年,5月20日,3点42分,星期一
利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。
利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。
2、应用
第6页,共17页,2022年,5月20日,3点42分,星期一
与主成分分析相同,也是一种多变量化简、降维技术。
在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,每一类变量代表了一个“共同因子”,即一种内在结构。因子分析就是要寻找该结构。
在实际应用中,有时两者不加区分
三、因子分析 1、概述
第7页,共17页,2022年,5月20日,3点42分,星期一
为了找出变量间内在结构,要求因子分析满足以下条件:
样本量
样本量与变量数的比例应在5: 1以上
总样本量最好大于100,而且原则上越大越好
各变量间必须有相关性
KMO统计量:在(0,1)之间,, -, -,
Bartlett’s球形检验:对变量间的独立性进行检验,若变量间相互独立(),因子分析无效
2、适用条件
第8页,共17页,2022年,5月20日,3点42分,星期一
判断数据是否符合要求,是否有必要进行主成分/因子分析
对原有变量标准化,以消除计量单位和数据基数的影响(SPSS会自动对原始变量标准化)
根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量
进行分析,按一定标准确定提取的主成分/因子数
3、步骤
第9页,共17页,2022年,5月20日,3点42分,星期一
如果进行的是主成分分析,步骤到此结束
如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载荷向0、1分化,以寻求最佳解释
如有必要,计算因子得分等中间指标供进一步分析使用
第10页,共17页,2022年,5月20日,3点42分,星期一
特征根(Eigenvalue ):是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的多少。特征根大于1,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于1作为抽取因子的标准。
方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。
累计贡献率
4、输出统计量
第11页,共17页,2022年,5月20日,3点42分,星期一