1 / 52
文档名称:

主成分分析与因子分析课件.pptx

格式:pptx   大小:3,190KB   页数:52页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析与因子分析课件.pptx

上传人:rsqcpza 2022/8/8 文件大小:3.12 MB

下载得到文件列表

主成分分析与因子分析课件.pptx

相关文档

文档介绍

文档介绍:主成分分析和因子分析
第1页,共52页。
汇报什么?
假定你是一个公司的财务经理,掌握了公司的所有数据,比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和
第12页,共52页。
主成分分析
对于多维变量的情况和二维类似,也有高维的椭球,只不过无法直观地看见罢了。
首先把高维椭球的主轴找出来,再用代表大多数数据信息的最长的几个轴作为新变量;这样,主成分分析就基本完成了。
注意,和二维情况类似,高维椭球的主轴也是互相垂直的。这些互相正交的新变量是原先变量的线性组合,叫做主成分(principal component)。
第13页,共52页。
主成分分析的数学模型
假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。
第14页,共52页。
这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。
第15页,共52页。
满足如下的条件:
主成分之间相互独立,即无重叠的信息。即
主成分的方差依次递减,重要性依次递减,即
每个主成分的系数平方和为1。即
第16页,共52页。
样本数据的标准化可解决平移问题
根据旋转变换的公式:
第17页,共52页。
主成分分析
正如二维椭圆有两个主轴,三维椭球有三个主轴一样,有几个变量,就有几个主成分。
选择越少的主成分,降维就越好。什么是标准呢?那就是这些被选的主成分所代表的主轴的长度之和占了主轴长度总和的大部分。有些文献建议,所选的主轴总长度占所有主轴长度之和的大约85%即可,其实,这只是一个大体的说法;具体选几个,要看实际情况而定。
第18页,共52页。
对于我们的数据,SPSS输出为
这里的Initial Eigenvalues就是这里的六个主轴长度,又称特征值(数据相关阵的特征值)。%。后面的特征值的贡献越来越少。
第19页,共52页。
特征值的贡献还可以从SPSS的所谓碎石图看出
第20页,共52页。
因子载荷反映的是主成分与变量间的相关系数。
主成分载荷与因子载荷
第21页,共52页。
可以把第一和第二因子的载荷点出一个二维图以直观地显示它们如何解释原来的变量的。这个图叫做载荷图。
第22页,共52页。
该图左面三个点是数学、物理、化学三科,右边三个点是语文、历史、外语三科。
第23页,共52页。
因子分析 (Factor Analysis)
第24页,共52页。
主要内容
一、什么是因子分析
二、因子分析模型
三、因子载荷矩阵中的几个统计特征
四、因子旋转
五、因子得分
六、在SPSS上进行因子分析的步骤
第25页,共52页。
因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。
例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。
一、什么是因子分析
第26页,共52页。
但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。而这三个公共因子可以表示为:
称 是不可观测的潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分 ,称为特殊因子。
第27页,共52页。
二、因子分析模型
数学模型
设 个变量,如果表示为
第28页,共52页。
注:
因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;
主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。
主成分分析:原始变量的线性组合表示新的综合变量,即主成分,无