文档介绍:第五章 主成分分析
1
编辑ppt
什么是主成分分析
主成分分析(Principal Components Analysis)
也称主分量分析
是将多个指标,化为少数几个不相关的
综合指标的一种统计方法。
2
编辑ppt
在综合评价工业企业的经济效益中,考核指标有:
1每百元固定资产原值实现产值、
2每百元固定资产原值实现利税、
3每百元资金实现利税、
4每百元工业总产值实现利税、
5每百元销售收入实现利税、
6每吨标准煤实现工业产值、
7每千瓦电力实现工业产值、
8全员劳动生产率、
9每百元流动资金实现的产值
指标间信息有重叠,指标数量又多。
经过主成分分析计算,最后确定选择了2个主成分作为综合评价工业企业经济效益的依据,变量数由9个减少到2个,%,使所研究的问题简化。
3
编辑ppt
第一节 主成分分析的几何意义
4
编辑ppt
X1
X2
几何意义:
为了直观,先在二维空间中讨论主成分的几何意义。
设对每个样品观测两个变量X1和X2的数据如下
X1
1 2 3 4 5 6
X2
2 4 6 8 10 12
样品点完全在同一条直线上。
X1
X2
其散点图如下
5
编辑ppt
θ
X1
Y2
X2
Y1
因为样品点都在Y1轴上,Y1方向有离散性,Y2方向无离散性,
也就无区别。可以用Y1来描述这些样品点,,因此在新坐标系
中只需用Y1一个变量就可以描述原来需用两个变量X1和X2描述
的样品。那么Y1包含了原来变量X1和X2的100%的信息。
在实际问题中,这样的情况是很少见的。
6
编辑ppt
一般情况下,例如有n个样品,每个样品有两个变量值X1和X2,这n个样品的散点图如带状.
由图可见这n个样品点无论是沿着X1轴方向或X2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量X1的方差和X2的方差定量地表示。
X1
X2
7
编辑ppt
θ
X2
Y2
Y1
X1
同样我们将X1轴和X2轴同时按逆时针方向旋转θ角度,得到新坐标轴Y1和Y2 。 Y1和Y2是两个新变量。根据解析几何中的坐标旋转变换公式:
8
编辑ppt
第二节 主成分的求解
假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为
X1,X2,…,Xp
主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题
9
编辑ppt
主成分分析通常的做法是,寻求原指标的线性组合Yi。
并且满足:
1 (i=1,2, …P) *
2 不相关性,Yi与Yj不相关。
3 方差极大条件,
10
编辑ppt