1 / 50
文档名称:

主成分分析与因子分析.ppt

格式:ppt   大小:2,842KB   页数:50页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析与因子分析.ppt

上传人:卓小妹 2022/3/27 文件大小:2.78 MB

下载得到文件列表

主成分分析与因子分析.ppt

相关文档

文档介绍

文档介绍:主成分分析与因子分析
第一页,讲稿共五十页哦
学****主成分分析的意义?
研究多个变量之间的依存关系是统计分析的一个重要任务。
分析多个变量之间的依存关系时,经常遇到两个问题:
指标个数过多
指标之间“高度”相关
.28
Negative correlated
High correlated
*
第十页,讲稿共五十页哦
例2的分析结果:
模型总体检验:p=,R-sq=
参数估计和检验
Var DF Est SE T Prob > |T|
int 1
X1 1 - -
X2 1 - -
X3 1 - -
X4 1
Error Sign
*
第十一页,讲稿共五十页哦
问 题
寻找一种合理的综合性方法,使得:
减少指标变量的个数。
尽量不损失或者稍损失原指标变量中所包含的信息。(用方差衡量)
使得原本相关的指标转化为彼此不相关(用相关系数阵衡量)
*
第十二页,讲稿共五十页哦
多元统计分析中存在的问题和解决方法
主要存在问题
多指标问题
主要解决方法
主成分分析
因子分析
结构方程模型
multivariate
*
第十三页,讲稿共五十页哦
什么是主成分分析?
将彼此相关的指标变量转化为 彼此不相关的指标变量;
将个数较多的指标变量转化为 个数较少的指标变量。
将意义单一的指标变量转化为 意义综合的指标变量。
*
第十四页,讲稿共五十页哦
第一节 主成分分析的基本原理
最简情形:
相关数据的散点图:
序号 胸围 体重
Id x1 x2
1 14
2 13
……
n 25
*
第十五页,讲稿共五十页哦
基本原理
原坐标系:
。x1,x2相关
。x1,x2变异均匀
新坐标系:
。Z1,Z2不相关
。Z1,Z2变异不均匀
var(Z1)>var(Z2)
坐标变换公式:
z1= cosθx1 + sinθx2 + c1
z2=-sinθx1 + cosθx2 + c2
坐标变换
忽略不计
*
第十六页,讲稿共五十页哦
基本原理
坐标变换公式:
Z1= cosθX1+sinθX2
Z2=-sinθX1+cosθX2
Z1= a11 X1 +a12 X2
Z2= a21 X1 +a22 X2
X→Z
线性变换
线性变换
标准化变量:
*
第十七页,讲稿共五十页哦
主成分分析的基本原理 Basic Principle
寻找一个适当的线性变换:
将彼此相关的变量转变为彼此不相关的新变量;
方差较大的几个新变量就能综合反应原多个变量所包含的主要信息;
新变量各自带有独特的专业含义。
*
第十八页,讲稿共五十页哦
对应m个变量的q个主成分(q≤m)
… …
PCA数学模型
*
第十九页,讲稿共五十页哦
PCA解法及性质
Cov(X )A
Var( Z1)
=A Var( Z2)

Var( Zm)
求主成分实际上就是要求满足正交矩阵A即求随机变量X的协方差矩阵Cov(X )的特征根(eigenvalue)和特征向量(eigenvector)。
*
第二十页,讲稿共五十页哦
主成分的性质
1)E(Zi)=0
2)var(Zi) =λi --- V(X)的特征值
3)Var(Z1)≥var(Z2)≥…≥var(Zk)
4)var(Z1)+…+var(Zk)=k
5)corr(Zi Zj )=0
6)corr(Zi, Xj )=ai j * (λi )1/ 2
7)(ai1)2+(ai2)2+…+(aik)2=1
*
第二十一页,讲稿共五十页哦