1 / 17
文档名称:

第八讲 主成分分析和因子分析.ppt

格式:ppt   大小:975KB   页数:17页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第八讲 主成分分析和因子分析.ppt

上传人:卓小妹 2022/4/16 文件大小:975 KB

下载得到文件列表

第八讲 主成分分析和因子分析.ppt

文档介绍

文档介绍:第八讲 主成分分析和因子分析
本讲稿第一页,共十七页
变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息的基础,降低维度,将原来的多个变量组合成相互独立的少数的、新的综合变量。
变量解释。利用新变量进一步探讨变量内在联第八讲 主成分分析和因子分析
本讲稿第一页,共十七页
变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息的基础,降低维度,将原来的多个变量组合成相互独立的少数的、新的综合变量。
变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。

因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。

本讲稿第二页,共十七页
二、主成分分析 1、基本原理
统计信息实际上是指数据变异信息
右图中,在椭圆的长轴方向数据变异明显大于短轴方向
本讲稿第三页,共十七页
F1
F2
F1与F2不相关
沿长、短轴方向设定新坐标系,长轴变量承载大部分变异信息,短轴变量承载少量变异信息.
一个长轴新变量F1就可以代表原来两个变量的主要信息,从而起到降维作用
在主成分分析中,提取出的每个新变量(主成分)都是原来多个变量的线性组合
本讲稿第四页,共十七页
如由两个原始变量X1和X2,可提取两个主成分:
  F1 =a11X1 +a21X2
  F2 =a12X 1 +a22X2
依次类推:由N个原始变量可提取N个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义.
一般情况下按贡献率由大到小,取累计贡献率达到85%的前2~3个主成分,其他的忽略不计。
在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。
本讲稿第五页,共十七页
利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。
利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。
2、应用
本讲稿第六页,共十七页
与主成分分析相同,也是一种多变量化简、降维技术。
在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,每一类变量代表了一个“共同因子”,即一种内在结构。因子分析就是要寻找该结构。
在实际应用中,有时两者不加区分
三、因子分析 1、概述
本讲稿第七页,共十七页
为了找出变量间内在结构,要求因子分析满足以下条件:
样本量
样本量与变量数的比例应在5: 1以上
总样本量最好大于100,而且原则上越大越好
各变量间必须有相关性
KMO统计量:在(0,1)之间,, -, -,
Bartlett’s球形检验:对变量间的独立性进行检验,若变量间相互独立(),因子分析无效
2、适用条件
本讲稿第八页,共十七页
判断数据是否符合要求,是否有必要进行主成分/因子分析
对原有变量标准化,以消除计量单位和数据基数的影响(SPSS会自动对原始变量标准化)
根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量
进行分析,按一定标准确定提取的主成分/因子数
3、步骤
本讲稿第九页,共十七页
如果进行的是主成分分析,步骤到此结束
如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载荷向0、1分化,以寻求最佳解释
如有必要,计算因子得分等中间指标供进一步分析使用
本讲稿第十页,共十七页
特征根(Eigenvalue ):是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的多少。特征根大于1,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于1作为抽取因子的标准。
方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。
累计贡献率
4、输出统计量
本讲稿第十一页,共十七页
变量Xi的变量共同度:也称公因子方差比,是提取公因子后,各变量中信息被提取出的比例,或者说原变量的信息量(方差)由公因子决定的比例
旋转前/后因子载荷:反映因子和各个变量间的密切程度的指标,实质是两者间的相关系数
因子得分函数系数
本讲稿第十二页,共十七页
公因子数量的确定
主成分的累积贡献率:85%以上
特征根:大于1
综合判断。 因子分析时更重要的是因子的可解释性,必要时保留特征根小于1的因子
利用碎