1 / 61
文档名称:

应用统计学主成分分析.ppt

格式:ppt   页数:61页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

应用统计学主成分分析.ppt

上传人:pk5235 2015/9/26 文件大小:0 KB

下载得到文件列表

应用统计学主成分分析.ppt

相关文档

文档介绍

文档介绍:主成分分析
主成分分析:将原来较多的指标简化为少数几个新的综合指标的多元统计方法。
主成分:由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。
主成分与原始变量间的关系:
1、主成分保留了原始变量绝大多数信息。
2、主成分的个数大大少于原始变量的数目。
3、各个主成分之间互不相关。
4、每个主成分都是原始变量的线性组合。
主成分分析的运用:
1、对一组内部相关的变量作简化的描述
2、用来削减回归分析或群集分析(Cluster)中变量的数目
3、用来检查异常点
4、用来作多重共线性鉴定
5、用来做原来数据的常态检定
二、数学模型与几何解释-数学模型
假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。
这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。
满足如下的条件:
1、每个主成分的系数平方和为1。即
2、主成分之间相互独立,即无重叠的信息。即
3、主成分的方差依次递减,重要性依次递减,即
F1、F2….Fp分别称为原变量的第一、第二….第p个主成分。
数学模型与几何解释-几何解释
为了方便,我们在二维空间中讨论主成分的几何意义:
设有n个样品,每个样品有两个观测变量xl和x2,在由变量xl和x2 所确定的二维平面中,n个样本点所散布的情况如椭圆状。由图可以看出这n个样本点无论是沿着xl 轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量xl 的方差和x2 的方差定量地表示。显然,如果只考虑xl和x2 中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。
如果我们将xl 轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标轴Fl和F2。Fl和F2是两个新变量。
平移、旋转坐标轴