1 / 19
文档名称:

补充资料3主成分分析.docx

格式:docx   大小:89KB   页数:19页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

补充资料3主成分分析.docx

上传人:sssmppp 2021/3/4 文件大小:89 KB

下载得到文件列表

补充资料3主成分分析.docx

相关文档

文档介绍

文档介绍:地理系统要素关系的主成分分析
地理工作者在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域 的特征和“职能”,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会 增加分析问题的复杂性,能否通过某些线性组合,使原始变量减少为有代表意义的少数几个 新的变量,以少数几个指标或''成分”来代表多数指标?这是对地理系统进行分析的关键问 题。例如在环境研究中,需要对许多环境要素进行观测;在土地资源研究中,需要对土壤样 品进行多指标的分析化验。例如有30个测试指标,也许10多种指标即可代表。由此可见减 少研究的要素,使系统简化,是地理学研究中的重要环节。事实上,如果复杂的地理系统, 不加以任何简化,不抓住对地理系统影响的主要矛盾,要对之进行深入的研究,几乎是不可 能的。
本章介绍解决上述问题的数学方法——主成分分析,它是原始变量的线性组合,但较原 始变量更集中更典型地表明研究对象的特征。因为主成分析的数学原理比较简单易懂,因此 它在地理学研究中应用较为广泛。
7. 1主成分分析方法的原理
主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法。设有n个地理 区域,每个地理区域测得p个指标,总共有n*p观测数据。若n=100,p=10,则有1000个地 理数据,如何从这么多指标的数据中抓住地理事物的内在规律性呢?如前所述,多数情况下, 指标之间存在着相关关系,这时要弄清它们的规律须在p维空间中加以考察,这是比较麻烦 的。为了克服这一困难,一个自然的想法是找较少的综合指标来代表原来较多的指标,而这 些较少的综合指标既能尽量多地反映原来较多指标的信息,它们彼此之间又是独立的。综合 指标如何选取呢?通常是取原指标的线性组合,使综合指标之间相互独立且代表性最好。
如果原来单项指标记为斗,》2,…,七;它们的综合指标记为Z],Z2,…,< 〃)。特
别当p=2时,原指标是X], 了2。
设n个散布点大致为一个椭圆型。如图7-1,若在椭圆长轴方向取坐标Z”在椭圆短轴 方向取坐标Zm这相当于在平面上作一个坐标变换,显然变换后的坐标有下述性质。
zl
>X1
图7-1主成分分析的几何意义
n个点的坐标Z]和Z2的相关几乎为0。
二维平面上n个点的波动(方差)大部分可以归结为Zi轴上的波动,而Z2轴上 的波动是较小的。
于是称Z]和Z2是原指标也和了2的主成分。如果图7-1的椭圆是相当扁平的,则可考虑 Zi方向上的波动,忽视Z2方向的波动,不会犯很大错误。比如,这个椭圆的长轴方向将整 个信息反映了 75%,那么,仅用Zi来表达X排口了2还是可以的,这样二维就可以降为一维了, Z1就是XjW2的综合指标。显然:
Zj = lnxl +lnx2 (7-1)
如果取椭圆的短轴作为第二主成分Z2,图上的点对原指标五,了2的值记作{Xal }' {%a2 } 5
对主成分Zi,Z2的值记作{zal],{za2} 则有
一天)+ £《2 - 元2)2 = £(%] — +£(七2 ~ Z2)2 ( 7-2 )
a=l a=l a=l a=l
**********^ 1444444244444S
75% 25%
所谓Zi所反映的信息,就是£(Z〃1 -诺2在整个平方和中占的比例,这个比例越大越 a=l
好,即Z1的平方和(方差)越大越好。Z1取什么方向使它的平方和(或方差)达到极大呢? 这就是主成分分析首先要解决的问题。
如果有P个指标xl,x2,---,xp,将它们综合成秫(< P)个指标,即
Z1 =/疽1+/12尤2+・・・+匕叫,
乙2 =,21尤1 +,22尤2 + …+ 】2pXp,
<
(7-3)
Z = / H 1 X
、tn ml 1 m2 2 mp p
系数4由下列原则来决定:
V
Z,.与 Zj(z* j,i,j = 1,2,•••,m)互相无关;
Zi是xl,x2,---xp的一切线性组合中方差最大的;Z2是与Zi不相关的xl,x2,---,xp的 所有线性组合中方差最大的;…;是与都不相关的的所有线 性组合中方差最大的。
这样决定的综合指标Zi,Z2,・“z,”分别称做原指标的第一,第二,…,第m主成分。其中 Zi在总方差中占的比例最大,其余主成分z2,z3---,zm的方差依次递减。在实际工作中常挑 选前几个最大的主成分,这样既减少了指标的数目,又抓住了主要矛盾,简化了指标之间的 关系。
从几何上看,找主成分的问题,就是找出p维空间中椭球体的主轴问题,从数学上容 易得到它们是xtx2,•••,%,的相关矩阵中m个较大特征值所对应的特征向量。
7. 2主成分分析的解法
下面用一个简单的例子来说明主成分分析的解法。
设有一组