文档介绍:关于主成分分析方法
第一张,共六十张,创建于2022年,星期一
问题的提出
地理系统是多要素的复杂系统。变量太多,会增加分析问题的难度与复杂性,而且多个变量之间是具有一定的相关关系的
能否在相关分析的基础上,用较少的新变量代替第十八张,共六十张,创建于2022年,星期一
所以上述条件等同于
因此,如果原坐标旋转后的Y1轴是我们要求的使Var(Y1)最大的直线的话,则必然有Var(Y2)最小,且 。这说明6个样方点对新坐标的离差矩阵应为
是对角矩阵,并且
第十九张,共六十张,创建于2022年,星期一
和 是对称离差矩阵S的两个特征根( ),而U的每一行是相应的特征向量
第二十张,共六十张,创建于2022年,星期一
一、主成分的基本理论
第二十一张,共六十张,创建于2022年,星期一
第二十二张,共六十张,创建于2022年,星期一
二、主成分分析的几何解释
进行主成分分析的目的,就是找出转换矩阵U
第二十三张,共六十张,创建于2022年,星期一
§2 主成分分析的解法
一、用方差—协方差矩阵求解主成分例
例:设有一组古生物腕足动物贝壳标本的两个变量:-1.
第二十四张,共六十张,创建于2022年,星期一
X1
X2
X1
X2
3
2
12
10
4
10
12
11
6
5
13
6
6
8
13
14
6
10
13
15
7
2
13
17
7
13
14
7
8
9
15
13
9
5
17
13
9
8
17
17
9
14
18
19
10
7
20
20
11
12
第二十五张,共六十张,创建于2022年,星期一
1、方差—协方差的计算
第二十六张,共六十张,创建于2022年,星期一
主成分分析的实质;
就是要求出方差—协方差矩阵的特征向量及其对应的特征值,即要找出方差—协方差矩阵所确定的椭球的主轴,交确定其长度
第二十七张,共六十张,创建于2022年,星期一
方差—协方差矩阵为
求特征值
第二十八张,共六十张,创建于2022年,星期一
特征向量的求解
当 时,
化为联立方程
求得
同理求得 时的特征向量
第二十九张,共六十张,创建于2022年,星期一
算出
第一主成分I:,特征向量为
第二主成分II:,特征向量为
第三十张,共六十张,创建于2022年,星期一
特征向量的方向由I、II中包括的两个数字控制
,。。可见,两个主成分Z1、Z2所代表的信息分别为86%和14%。如果用Z1代表原来的数据,则仅损失信息14%。但若用X1和X2来代表原来的数据,则将损失信息46%或54%。
第三十一张,共六十张,创建于2022年,星期一
3、主成分得分的计算
根据(8-3)式,得到主成分的表达式为
第三十二张,共六十张,创建于2022年,星期一
原始数据的主成分得分
Z1
Z2
Z1
Z2
-
-
-
-
-
-
-
第三十三张,共六十张,创建于2022年,星期一
二、主成分分析的步骤
对原始地理数据
第三十四张,共六十张,创建于2022年,星期一
进行标准化处理(标准差标准化),即
其中
第三十五张,共六十张,创建于2022年,星期一
计算相关系数矩阵R
第三十六张,共六十张,创建于2022年,星期一
计算特征值和特征向量
根据特征方程 计算特征值,即解
的特征多项式,