1 / 203
文档名称:

主成分分析和因子分析课件.ppt

格式:ppt   大小:3,210KB   页数:203页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析和因子分析课件.ppt

上传人:kuailonggua 2024/5/7 文件大小:3.13 MB

下载得到文件列表

主成分分析和因子分析课件.ppt

相关文档

文档介绍

文档介绍:该【主成分分析和因子分析课件 】是由【kuailonggua】上传分享,文档一共【203】页,该文档可以免费在线阅读,需要了解更多关于【主成分分析和因子分析课件 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。*第十三章主成分分析和因子分析在建立多元回归模型时,为了更准确地反映事物的特征,人们经常会在模型中包含较多相关解释变量,这不仅使得问题分析变得复杂,而且变量之间可能存在多重共线性,使得数据提供的信息发生重叠,甚至会抹杀事物的真正特征。为了解决这些问题,需要采用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。本章介绍的主成分分析和因子分析可用于解决这类问题。*主成分分析(ponentsanalysis,简称PCA)是由霍特林(Hotelling)于1933年首先提出的。它通过投影的方法,实现数据的降维,在损失较少数据信息的基础上把多个指标转化为几个有代表意义的综合指标。*,记为X1,X2,…,Xp,由这p个随机变量构成的随机向量为X=(X1,X2,…,Xp)?,设X的均值向量为?,协方差矩阵为?。设Y=(Y1,Y2,…,Yp)?为对X进行线性变换得到的合成随机向量,即()设?i=(?i1,?i2,…,?ip)?,(),A=(?1,?2,…,?p)?,则有()*且()由式()和式()可以看出,可以对原始变量进行任意的线性变换,不同线性变换得到的合成变量Y的统计特征显然是不一样的。每个Yi应尽可能多地反映p个原始变量的信息,通常用方差来度量“信息”,Yi的方差越大表示它所包含的信息越多。由式()可以看出将系数向量?i扩大任意倍数会使Yi的方差无限增大,为了消除这种不确定性,增加约束条件:*(方差)的贡献大小,而对于原始随机变量X1,X2,…,Xp,其协方差矩阵或相关矩阵正是对各变量离散程度和相关程度的度量。在实际求解主成分时,一般从原始变量的协方差矩阵或相关矩阵的结构分析出发。*?1是任意p?1向量,求解主成份就是在约束条件下,求X的线性函数使其方差达到最大,即达到最大,且,其中?是随机变量向量X=(X1,X2,…,Xp)?的协方差矩阵。设?1≥?2≥…≥?p≥0为?的特征值,e1,e2,…,ep为?矩阵各特征值对应的标准正交特征向量,则对于任意的ei和ej,有()且()*因此()当?1=e1时有()此时达到最大值为?1。同理有并且()*?,即()性质2设?=(?ij)p×p是随机变量向量X的协方差矩阵,可得即*由此可见,主成分分析是把p个随机变量的总方差分解为p个不相关随机变量的方差之和?1+?2+…+?P,则总方差中属于第i个主成分(被第i个主成分所解释)的比例为()称为第i个主成分的贡献度。定义()称为前m个主成分的累积贡献度,衡量了前m个主成份对原始变量的解释程度。*,为了消除原始变量量纲的影响,通常将数据标准化。考虑下面的标准化变化,令()其中?i,?ii分别表示随机变量Xi的期望与方差,则