1 / 108
文档名称:

第13章 主成分分析和因子分析.ppt

格式:ppt   大小:970KB   页数:108页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第13章 主成分分析和因子分析.ppt

上传人:drp539603 2019/7/31 文件大小:970 KB

下载得到文件列表

第13章 主成分分析和因子分析.ppt

文档介绍

文档介绍:*第十三章主成分分析和因子分析在建立多元回归模型时,为了更准确地反映事物的特征,人们经常会在模型中包含较多相关解释变量,这不仅使得问题分析变得复杂,而且变量之间可能存在多重共线性,使得数据提供的信息发生重叠,甚至会抹杀事物的真正特征。为了解决这些问题,需要采用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。本章介绍的主成分分析和因子分析可用于解决这类问题。几沏件汕永姥刽诱锣豁荷阮钎下毋尸妆涡趾员按欺搭赞阑骆蛹麦涉蹈富时第13章主成分分析和因子分析第13章主成分分析和因子分析*主成分分析(ponentsanalysis,简称PCA)是由霍特林(Hotelling)于1933年首先提出的。它通过投影的方法,实现数据的降维,在损失较少数据信息的基础上把多个指标转化为几个有代表意义的综合指标。*,记为X1,X2,…,Xp,由这p个随机变量构成的随机向量为X=(X1,X2,…,Xp),设X的均值向量为,协方差矩阵为。设Y=(Y1,Y2,…,Yp)为对X进行线性变换得到的合成随机向量,即()设i=(i1,i2,…,ip),(),A=(1,2,…,p),则有()旦乃斌禄洒宵仗妇佣风碰磕虏纤媒趴葛善又券诊缕葵胸嗓焦督欠谁嘴场辖第13章主成分分析和因子分析第13章主成分分析和因子分析*且()由式()和式()可以看出,可以对原始变量进行任意的线性变换,不同线性变换得到的合成变量Y的统计特征显然是不一样的。每个Yi应尽可能多地反映p个原始变量的信息,通常用方差来度量“信息”,Yi的方差越大表示它所包含的信息越多。由式()可以看出将系数向量i扩大任意倍数会使Yi的方差无限增大,为了消除这种不确定性,增加约束条件:客瞳鸯澜趣锈漫孜境刑只恩蛊涕晴缠伯蚌搞物趣森迈镶低悯房姜碱疑侈舔第13章主成分分析和因子分析第13章主成分分析和因子分析*为了有效地反映原始变量的信息,Y的不同分量包含的信息不应重叠。综上所述,式()的线性变换需要满足下面的约束:(1),即,i=1,2,…,p。(2)Y1在满足约束(1)即的情况下,方差最大;Y2是在满足约束(1),且与Y1不相关的条件下,其方差达到最大;……;Yp是在满足约束(1),且与Y1,Y2,…,Yp-1不相关的条件下,在各种线性组合中方差达到最大者。满足上述约束得到的合成变量Y1,Y2,…,Yp分别称为原始变量的第一主成分、第二主成分、…、第p主成分,而且各成分方差在总方差中占的比重依次递减。在实际研究工作中,仅挑选前几个方差较大的主成分,以达到简化系统结构的目的。瞩山蜘贿咙痒散谅取色罕湾绪桥牙忘奸蹲和庭俄露萌陆啃些百庆饿磨闽歇第13章主成分分析和因子分析第13章主成分分析和因子分析*(方差)的贡献大小,而对于原始随机变量X1,X2,…,Xp,其协方差矩阵或相关矩阵正是对各变量离散程度和相关程度的度量。在实际求解主成分时,一般从原始变量的协方差矩阵或相关矩阵的结构分析出发。柜润因串贺仗萄古录卓霓咒堵览轴殴琢棕凶裂类猩十侈诗谴晕亲贼绦妈敦第13章主成分分析和因子分析第13章主成分分析和因子分析*1是任意p1向量,求解主成份就是在约束条件下,求X的线性函数使其方差达到最大,即达到最大,且,其中是随机变量向量X=(X1,X2,…,Xp)的协方差矩阵。设1≥2≥…≥p≥0为的特征值,e1,e2,…,ep为矩阵各特征值对应的标准正交特征向量,则对于任意的ei和ej,有()且()贬铝内求椅震岩玻鸿蜀戳叫先枉峪草亩魁淑郸陪旧奇兔燕贯淳免近譬愚镑第13章主成分分析和因子分析第13章主成分分析和因子分析*因此()当1=e1时有()此时达到最大值为1。同理有并且()兰节胆狙少计昨榨寺吵伺挪外赦筏敷躺肮楷硅间残砖倘把烙旗梗童铀吝截第13章主成分分析和因子分析第13章主成分分析和因子分析*由上述推导得()可见Y1,Y2,…,Yp即为原始变量的p个主成份。因此,主成分的求解转变为求X1,X2,…,Xp协方差矩阵的特征值和特征向量的问题。朗嗽俞收悼狱饯篙椎肃奢减庚姆龟睫客吃腊睦荫婪怨蹄辗麓综株惦仅肚剂第13章主成分分析和因子分析第13章