1 / 35
文档名称:

第4章 主成分分析与因子分析.ppt

格式:ppt   大小:791KB   页数:35页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第4章 主成分分析与因子分析.ppt

上传人:changjinlai 2018/3/6 文件大小:791 KB

下载得到文件列表

第4章 主成分分析与因子分析.ppt

相关文档

文档介绍

文档介绍:第4章主成分分析与因子分析
主成分分析
引言
实际问题中涉及众多变量,但变量较多且有相互性,.
分析二元变量
次观测

其散布图近似为椭圆,,转角为:

反映了在彼此不相关的两个方向上的分散性.
相应变量

,.
总体主成分

非负定.

线性变换:

第一主成分在约束条件下,求,使,第一主成分
第二主成分求,使不相关.
在约束条件下,求,使第二主成分.
一般地,在约束条件及下,求
使第主成分.

是的协方差矩阵, 的特征值及相应的单位正变化特征向量分别为及,则的第个主成分为
其中
证①,且
设为的第一主成分, 令,

当时,等号成立,这时,故知
②设为的第二主成分,则有且

令,则



取,即
.

(1)主成分的协方差矩阵及总方差,
记为主成分向量,则,且

主成分的总方差

第个主成分的贡献率

前个主成分的累计贡献率
要求累计贡献率有较高比例(如80%~90%)
主成分,达到降维目的.
(2)主成分与变量的相关系数
与相关系数
设随机变量的协方差矩阵为
求的各主成分.
解 PROC P 过程,算得的特征值及单位正交特征向量:
,.

设标准化变量
标准化随机向量, 的协方差矩阵即的相关矩阵,通常由出发进行主成分分析. 的第个主成分
其中为的特征值, 是相应于的单位正交特征向量.
第个主成分贡献率为,前个主成分累计贡献为, 与的相关系数.
样本主成分
实际问题中, 或未知,需用样本估计
容量为个样本,用样本协方差矩阵及样本相关矩阵

的特征值,
个观测值代入第样本主成分,得的个观测值,称为第个主成分得分.
.
对10名男中学生身高、胸围和体重进行测量,得数据如下,作主成分分析.
解由PROC P 过程,从样本协方差矩阵出发进行主成分分析,算得
魁梧因子
形状因子
%.
obs
x1
x2
x3
1



2



3



4



5



6



7



8



9



10