1 / 24
文档名称:

主成分分析.ppt

格式:ppt   页数:24页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析.ppt

上传人:zhangbing32159 2014/8/28 文件大小:0 KB

下载得到文件列表

主成分分析.ppt

文档介绍

文档介绍:主成分分析
主成分分析(ponents analysis)也称主分量分析,1901年由Pearson首先引入,1933年由Hotelling作了进一步的发展。主成分分析是从多个数值变量(指标)之间的相互关系入手,利用降维的思想,将多个变量(指标)化为几个互不相关的综合变量(指标)的统计方法。
主要内容
主成分的定义
主成分的计算
主成分的性质
主成分的应用
主成分评价
主成分回归
正确应用
为什么要用主成分
变量间的相关:信息重叠
变量太多:降维分析(简化)
变量间的关系复杂:综合分析
某小学10名男学生六个项目的智力测量计分表
受试者
常识
算术
理解
填图
积木
译码
合计
编号
X1
X2
X3
X4
X5
X6
1
14
13
28
14
22
39
130
2
10
14
15
14
34
35
122
3
11
12
19
13
24
39
118
4
7
7
7
9
20
23
73
5
13
12
24
12
26
38
125
6
19
14
22
16
23
37
131
7
20
16
26
21
38
69
190
8
9
10
14
9
31
46
119
9
9
8
15
13
14
46
105
10
9
9
12
10
23
46
109
核心问题:
6门功课代表了几个方面的素质?
如何综合评价10名学生的成绩?(用合计?)
综合指标
尽可能多地反映原指标的信息。
信息的涵义:变异。
变异越大,信息量越丰富。
相关系数矩阵
一、      主成分分析的基本思想
例:儿童生长发育的评价:身高、体重、胸围、头高、坐高、肺活量等许多指标。
众多指标指标之间经常是相互联系和影响, 通过对原始指标相互关系的研究
找出少数几个综合指标
特点:1 原始指标的线性组合 2 保留原始指标的主要信息,且又互不相关。
二主成分分析的数学模型及几何意义
寻找一组常数,
使m个指标的线性组合:
主成分的定义
且使Var(C1)最大,则称C1为第一主成分。
2 若且
1 若且
且使Var(C2)最大,则称C2为第二主成分。
垂直于