1 / 143
文档名称:

第六讲主成分分析.ppt

格式:ppt   大小:5,787KB   页数:143页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第六讲主成分分析.ppt

上传人:文库新人 2021/11/30 文件大小:5.65 MB

下载得到文件列表

第六讲主成分分析.ppt

文档介绍

文档介绍:第六讲主成分分析
*
第一页,课件共143页
主要内容
§1 主成分分析的基本思想
§2 数学模型与几何解释
§3 主成分的推导
§4 主成分的性质
§5 主成分分析的步骤
§6 主成分分析的应用
第二页,课件共143页
§1 主成分分析基本思想 (案例)
主成分分析的典型案例是美国统计学家斯通(stone)在1947年关于国民经济的研究
依据美国1929一1938年的数据,利用了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等
经过主成分分析,用三个新变量取代原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。%
有意思的是这三个变量都可以直接测量。斯通将得到的主成分与实际测量的总收入I、总收入变化率I以及时间t因素做相关分析,得到下表:
第三页,课件共143页
F1
F2
F3
I
I
t
F1
1
F2
0
1
F3
0
0
1
I

-

1
I
-

-
-
1
t
-
-
-
-
-
1
主成分与实测变量的相关分析
第四页,课件共143页
实践中遇到的问题
为了全面系统的分析和研究问题,必须考虑许多分析指标,这些指标从不同的侧面反映所研究对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性
主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法
在力保数据信息丢失最少的原则下,对多变量的截面数据进行最佳综合简化,对高维变量空间进行降维处理
很显然,识辨系统在一个低维空间要比在一个高维空间容易得多
主成分分析基本思想 (问题)
第五页,课件共143页
处理的思路
建立研究指标体系的少数几个线性组合,这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就是主成分
选取新指标 F1,F2,…,Fk (k≤p)的原则
按照保留主要信息量的原则,充分反映原指标的信息
新指标之间相互独立
主成分分析基本思想
第六页,课件共143页
假设实际问题有 p 个指标,我们把这 p 个指标看作 p 个随机变量,记为X1,X2,…,Xp
主成分分析就是要把这 p 个指标的问题,转变为讨论 p 个指标的线性组合的问题,即
§2 数学模型与几何解释
第七页,课件共143页
满足的条件:
②主成分之间相互独立,即无重叠的信息。即
③主成分的方差依次递减,重要性依次递减,即
①每个主成分的系数平方和为1。即
第八页,课件共143页
基于相关系数矩阵还是基于协方差矩阵做主成分分析
当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析
选择几个主成分
主成分分析的目的是简化变量,一般情况下主成分的个数应该少于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。
如何解释主成分所包含的经济意义
主成分分析涉及的问题
第九页,课件共143页
设有6个样品,每个样品有两个观测变量Xl和X2,观测数据如下
主成分的几何意义
X1
1
2
3
4
5
6
X2
2
4
6
8
10
12
上述数据的散点图如下所示
以二维空间为例
表1
第十页,课件共143页