1 / 7
文档名称:

主成分分析法.doc

格式:doc   大小:206KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析法.doc

上传人:ttteee8 2020/8/7 文件大小:206 KB

下载得到文件列表

主成分分析法.doc

相关文档

文档介绍

文档介绍:三主成分分析方法地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题屮,多个变量之问是具有一定的和关关系的。因此,我们就会很口然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,这里介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。一、主成分分析的基本原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度來看,这是一•种降维处理技术。假定有门个地理样本,每个样本共有P个变量描述,这样就构成了一个nXp阶的地理数据矩阵:兀12…SX=<X21•••—J•••…f••••••(1)£2…S如何从这么多变量的数据屮抓住地理事物的内在规律性呢?要解决这一问题,自然要在p维空问屮加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同吋它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为Xi,X2,…,xp,它们的综合指标 新变量指标为Zi,Z2,…,zm(mWp)。贝!J©內+厶2可+…,=^21X1+'22*2 ,+‘2,”5=_內+厶2兀2+・・・,+仏©在(2)式屮,系数1订由下列原则来决定:Zi与Zj(iHj;i,j=l,2,…,m)相互无关;(2)zi是X,X2,…,Xp的一"切线性组合中方差最大者;Z2是与乙不相关的X.,X-2,…,Xp的所有线性组合中方差最大者; ;Z“是与Z”Z2, Ze都不相关的X”X2,…,Xp的所有线性组合中方差最大者。这样决定的新变量指标Z,,z2,…,zm分别称为原变量指标X"x2,…,xP的第一,第二,…,第ni主成分。其屮,zi在总方差小占的比例最大,Zz,%,•・・,Zm的方差依次递减。在实际问题的分析屮,常挑选前几个最大的主成分,这样既减少了变量的数H,乂抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量X.(j=l,2,…,P)在诸主成分Zi(i二1,2,…,m)上的载荷lij(i=l,2,…,m;j=l,2,…,p),从数学上容易知道,它们分别是Ixz,…,Xp的相关矩阵的m个较大的特征值所对应的特征向量。二、主成分分析的计算步骤通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:(1)计算相关系数矩阵在公式(3)中,Fij(i,j=l,2,计算公式为…,P)为原来变量人与X,的相关系数,其■k-|辰(為-刃‘£(為-at因为R是实对称矩阵(即GF),所以只需计算其上三角元素或下三角元素即可。(2)计算特征值与特征向量首先解特征方程丨入I-R丨二0求出特征值X.(i=l,2,…,p),并使其按大小顺序排列,即22…,M入30;然后分别求出对应于特征值入i的特征向量e,(i=l,2,…,p)o(2)计算主成分贡献率及累计贡献率P 加 P主成