1 / 37
文档名称:

主成分分析法.ppt

格式:ppt   大小:1,749KB   页数:37页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析法.ppt

上传人:卓小妹 2022/7/4 文件大小:1.71 MB

下载得到文件列表

主成分分析法.ppt

相关文档

文档介绍

文档介绍:关于主成分分析法
第一张,共三十七张,创建于2022年,星期一
主成分分析法的基本原理
主成分分析(Principal Components Analysis)是由Hotelling于1933年首先提出的,它是利呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。
   可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。
   因子分析主要用于:1、减少分析变量个数;2、通过对变量间相关关系探测,将原始变量进行分类。即将相关性高的变量分为一组,用共性因子代替该组变量。
第十二张,共三十七张,创建于2022年,星期一
第十三张,共三十七张,创建于2022年,星期一
第十四张,共三十七张,创建于2022年,星期一
主成分分析的一般数学模型
变量
观测量
X1
X2
X3
X4
┅┅
Xm
1
X11
X12
X13
X14
┅┅
X1m
2
X21
X22
X23
X24
┅┅
X2m





┅┅

n
Xn1
Xn2
Xn3
Xn4
┅┅
Xnm
推广到一般情况,实测变量X1——Xm,共测得n个样品 :
第十五张,共三十七张,创建于2022年,星期一
原始数据矩阵为 :
X11 X12 ┅┅ X1m
X21 X22 ┅┅ X2m
┋ ┋ ┋
Xn1 Xn2 ┅┅ Xnm
X=
第十六张,共三十七张,创建于2022年,星期一
在原始变量的m维空间中,找到新的m个坐标轴,新变量与原始变量的关系可以表示为:
y1=u11x1+u12x2+ ┅┅ +u1mxm
y2=u21x1+u22x2+ ┅┅ +u2mxm
┅┅ ┅┅ ┅┅ ┅┅
ym=um1x1+um2x2+ ┅┅ +ummxm
并且满足uk12 + uk22 + ┅┅ + ukm2=1
k=1,2, ┅┅ ,m
第十七张,共三十七张,创建于2022年,星期一
系数uij由下列原则来确定:
(1)yi与yj (i≠ j, i, j=1,2, ┅┅ ,p)相互无关。
(2)y1是x1、x2、┅┅、xp的一切线性组合中方差最大者; y2是与y1不相关的x1、x2、┅┅、xp的所有线性组合中方差最大者; yp是与y1、y2、┅┅、yp-1都不相关的x1、x2、┅┅、xp的所有线性组合中方差最大者。
如此决定的综合变量y1、y2、┅┅、yp分别称为原始变量的第1、第2、┅、第p个主成分。其中y1在总方差中占的比重最大,综合变量y1、y2、┅┅、yp的方差依次递减,在具体分析时只挑选前几个方差最大的主成分,从而达到简化系统结构的目的。
第十八张,共三十七张,创建于2022年,星期一
主成分分析法的算法

主成分分析法原理应用于实际课题,必须解决两个问题:
一是随机向量x的协方差阵T 或相关系数阵R通常是未知的,需借助于随机抽样的途径,对T或R作出极大似然估计;
二是随机向量x的各个分量通常是不同的自然科学量或社会科学量,需通过标准化变换的方法,以解决不可公度的问题。
第十九张,共三十七张,创建于2022年,星期一
步骤1:采集p维随机向量x=(x1,x2,…,xp)T的n个样品xi=(xi1,xi2,…,xip)T, i=1,2, …,n, n>p,构造样本阵X
x1T x11 x12 ┅ x1p
x2T x21 x22 ┅ x2p
X= ┇ = ┇ ┇ ┇
xnT xn1 xn2 ┅ xnp
第二十张,共三十七张,创建于2022年,星期一
步骤2 对样本阵X中的元进行如下变换
x ij , 对正指标
Y ij =
- x ij, 对逆指标


Y= Y ij n×p
第二十一张,共三十七张,创建于