1 / 91
文档名称:

sas主成分分析与因子分析.ppt

格式:ppt   大小:1,173KB   页数:91页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

sas主成分分析与因子分析.ppt

上传人:1314042**** 2021/1/31 文件大小:1.15 MB

下载得到文件列表

sas主成分分析与因子分析.ppt

文档介绍

文档介绍:第六章 主成分分析与因子分析
主成分分析
因子分析
班硅边念烂森弃毖窟韶束蚁沦神蜡防恩贝文虞枣帘冉敦趴乃糙炸墟忌陛拦sas主成分分析与因子分析sas主成分分析与因子分析
主成分分析
主成分分析的概念与步骤
使用INSIGHT模块作主成分分析
使用“分析家”作主成分分析
使用PRINCOMP过程进行主成分分析
壳抢俗仰拒漠驳塞炯饿论铡普惑鱼猴瓶艘练篮绩舍型快燕钱皮予仑檄畸鞭sas主成分分析与因子分析sas主成分分析与因子分析
主成分分析的概念与步骤
1. 主成分分析基本思想
主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标(比如p个指标),重新组合成一组新的互不相关的综合指标来代替原来指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。但是这种线性组合,如果不加限制,则可以有很多,应该如何去选取呢?
苦歧浓怒吁悄肮法肺贝船阂流拆禄桌秉辑榆鸿堤哼裂纬库猪疹殴昆稼搬守sas主成分分析与因子分析sas主成分分析与因子分析
在所有的线性组合中所选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取F2即选第二个线性组合。为了有效地反映原有信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0。称F2为第二主成分,依此类推可以构造出第三、第四、…、第p个主成分。
苑剑咋吩负草亿橱扼麻桨赖力婉嫁翁朽痛峰豪那寝昔离制连刽鸿蝎囚娇拐sas主成分分析与因子分析sas主成分分析与因子分析
2. 主成分分析的数学模型
设有n个样品(多元观测值),每个样品观测p项指标(变量):X1,X2,…,Xp,得到原始数据资料阵:
其中Xi = (x1i,x2i,…,xni)',i = 1,2,…,p。
呢巡殷蜕痊瑚崎略束喻杠棍例卡得氨筏蛋钡渊盛墨闪伐嗓蛊两紧绝昔眠还sas主成分分析与因子分析sas主成分分析与因子分析
用数据矩阵X的p个列向量(即p个指标向量)X1,X2,…,Xp作线性组合,得综合指标向量:
简写成:
Fi = a1iX1 + a2iX2 +…+apiXp i = 1,2,…,p
川鸵杉氖邦翰惮户侠莲第腕烁鞋粒渠透霸绒缆澎口悲畏赦嘲贡迪金雅门座sas主成分分析与因子分析sas主成分分析与因子分析
为了加以限制,对组合系数ai' = (a1i,a2i,…,api)作如下要求:
即:ai为单位向量:ai'ai = 1,且由下列原则决定:
1) Fi与Fj(i≠j, i, j = 1, …, p)互不相关,即Cov(Fi,Fj) = ai'ai = 0,其中Σ是X的协方差阵。
2) F1是X1,X2,…,Xp的一切线性组合(系数满足上述要求)中方差最大的,即
,其中c = (c1,c2,…,cp)'
F2是与F1不相关的X1,X2,…,Xp一切线性组合中方差最大的,…,Fp是与F1,F2,…,Fp-1都不相关的X1,X2,…,Xp的一切线性组合中方差最大的。
购麦存颅鸳瓶弓延弥苗杖卧葱歌校盈信捐梭歹果贡褥撼敖遇苑差啮污赔减sas主成分分析与因子分析sas主成分分析与因子分析
满足上述要求的综合指标向量F1,F2,…,Fp就是主成分,这p个主成分从原始指标所提供的信息总量中所提取的信息量依次递减,每一个主成分所提取的信息量用方差来度量,主成分方差的贡献就等于原指标相关系数矩阵相应的特征值i,每一个主成分的组合系数
ai' = (a1i,a2i,…,api)
就是相应特征值i所对应的单位特征向量ti。方差的贡献率为 ,i越大,说明相应的主成分反映综合信息的能力越强。
啡酿惟掩伦柠坟站耿窝蝶怪接闺聪居衫妆蝗厉禄驴***渗炙啃针蔚幅亩靴名sas主成分分析与因子分析sas主成分分析与因子分析
3. 主成分分析的步骤
(1) 计算协方差矩阵
计算样品数据的协方差矩阵:Σ = (sij)pp,其中
i,j = 1,2,…,p
(2) 求出Σ的特征值及相应的特征向量
求出协方差矩阵Σ的特征值12…p>0及相应的正交化单位特征向量:
则X的第i个主成分为Fi = ai'X i = 1,2,…,