1 / 38
文档名称:

主成分分析法.ppt

格式:ppt   大小:1,809KB   页数:38页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析法.ppt

上传人:wo1230 2017/3/9 文件大小:1.77 MB

下载得到文件列表

主成分分析法.ppt

相关文档

文档介绍

文档介绍:优秀精品课件文档资料主成分分析法 主成分分析法的基本原理主成分分析( ponents Analysis )是由 Hotelling 于 1933 年首先提出的,它是利用降维的思想,把多指标转化为少数几个综合指标的多元统计分析方法。 基本思想对原始变量相关矩阵结构关系进行研究, 找出影响某一经济过程的几个综合指标,使综合指标变为原来变量的线性组合,从而不仅保留了原始变量的主要信息,彼此之间又不相关,更有助于抓住主要矛盾。借助于一个正交变换 T ,将其分量相关的原随机向量 x=(x 1,x 2,L, …,x p) T ,转化成其分向量不相关的新随机向量 u=(u 1,u 2,L, …,u p) T, 这在代数上表现为将 x 的协方差阵变换成对角形阵,在几何上表现为将远坐标系变换成新的正交坐标系,使之指向样本点散布最开的 p个正交方向,然后对多维变量系统进行降维处理, 使之能以一个较高的精度转换成低维度变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。定义: 称为第 k 主成分分量的方差贡献率, 称为前 k 个主成分分量的累计方差贡献率。 11 p k i i ? ???? ?? ?? ?? 1 1 1 pk i i i i ? ??? ?? ?? ?? ?? ?? ?? ?? ?例:儿童身高和体重两个变量之间的关系。下表表示儿童身高与体重数据: 变量观测量身高 h体重 w 1h 1w 1 2h 2w 2 3h 3w 3 ┋┋┋ nh nw n 使用散点图表示儿童身高与体重 y 1 y 2wh θ i=1 ,2,┅┅, n 以该直线为一个坐标轴 y 1,以该轴的垂直线为另一个坐标轴 y 2。因为所有观测点均在坐标轴 y 1周围,而 y 1 与y 2是两个相互垂直的坐标轴,因此彼此不相关。上述也可以看成是将 h轴和 w轴同时按逆时针方向旋转θ角度,得到新的坐标轴 y 1和 y 2,y 1和y 2是两个新的变量。根据旋转公式 y 1 =h cos θ+ w sin θ y 2 =-h sin θ+ w cos θ我们看到新变量 y 1和y 2是原变量 h和w的线性组合,它的矩阵表示形式为 y 1 cos θ sin θ h = =U ’x y 2 一 sin θ cos θ w 其中 U’为正交矩阵,即有 U’=U -1,U’ U -1 =I