1 / 48
文档名称:

主成分分析.ppt

格式:ppt   大小:2,839KB   页数:48页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析.ppt

上传人:卓小妹 2022/3/27 文件大小:2.77 MB

下载得到文件列表

主成分分析.ppt

相关文档

文档介绍

文档介绍:主成分分析
第一页,讲稿共四十八页哦
本章主要内容
前言
主成分的几何解释
主成分的数学模型
样本主成分的求解及其性质
主成分分析的进一步应用
第二页,讲稿共四十八页哦
例子(1)
一个人的身材需要用多项指标十八页,讲稿共四十八页哦
yl,y2除了可以对包含在xl,x2中的信息起着浓缩作用之外,还具有不相关(图形中表现为正交)的性质,这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。二维平面上的个点的方差大部分都归结在 yl 轴上,而y2轴上的方差很小。 yl 和 y2 称为原始变量xl和x2的综合变量。 y 简化了系统结构,抓住了主要矛盾。
第十九页,讲稿共四十八页哦
5维空间在平面上的投影
y2
y1
x1
x2
x3
x4
x5
第二十页,讲稿共四十八页哦
y1 =l11x1 +l21x2 +…+l51x5 y2 =l21x1 +l22x2 +…+l52x5
x1
x3
x5
x4
x2
y1
y2
第二十一页,讲稿共四十八页哦
标准化变换
记原始变量为Z,标准化后的变量记为X。作标准化变换:
原指标的相关系数矩阵 R
j =1, 2, …, p; k= 1, 2, …, n
第二十二页,讲稿共四十八页哦
主成分分析的数学模型
最简单的综合指标是原指标的线性组合,即将原始的 p个变量进行线性组合,作为新的变量,即
选择m个主成分:
第二十三页,讲稿共四十八页哦
对于m个综合指标y1, y2,…, ym要完成两件事:
1、 将原来p个指标所包含的n个个体的不十分明显的差异集中起来,使n个个体的综合指标值差异尽可能大;
2、 使综合指标的数目尽可能少,还要求各综合指标间互不相关。
综合指标y1, y2,…, ym称为原指标x1, x2,…, xp的主成分
第二十四页,讲稿共四十八页哦
样本主成分
从样本出发讨论
p个标准化指标x1, x2,…, xp的
主成分定义、求法和性质
第二十五页,讲稿共四十八页哦
术 语
x1, x2,…,xp的任一线性组合
的 n 个个体值分别为:
第二十六页,讲稿共四十八页哦
其均值与样本方差分别为:
第二十七页,讲稿共四十八页哦
x1, x2,…, xp的两个线性组合
则n个个体的这两个线性组合对应的值为:
第二十八页,讲稿共四十八页哦
其均值与协方差分别为:
第二十九页,讲稿共四十八页哦
定 义
第一主成分 中的 应在

的条件下,使

达到最大,即 使 n 个个体的值的差异尽可能大。
第三十页,讲稿共四十八页哦
第二主成分 中的 应在

的条件下,使

达到最大
等价于各综合指标间互不相关
第三十一页,讲稿共四十八页哦
第三主成分 中的 应在,

的条件下,使
达到最大。
第三十二页,讲稿共四十八页哦
主成分定义
称线性组合
为 x1, x2,…, xp 的第 j 个主成分
其系数向量
应满足如下条件:
1、正则条件:
2、正交条件:
3、最大方差条件:
使
达到最大
4、主成分的方差依次递减:
第三十三页,讲稿共四十八页哦
由定义可知,要确定 m 个主成分实际上就是要确定 m 个 p 维向量
第三十四页,讲稿共四十八页哦
引 理
设A是n 阶对称阵,
其特征根为 ,
对应的单位化特征向量为


且当 时,二次型
达到上确界。
第三十五页,讲稿共四十八页哦
求 法
由引理可知,求主成分便是求相关系数矩阵 R 的特征根及对应的单位化特征向量。
主成分在几何图形中的方向就是 R 的特征向量的方向
第三十六页,讲稿共四十八页哦
问 题
引入主成分的目的是为了减少指标的个数,那么 m 取多大?
第三十七页,讲稿共四十八页哦
样本主成分y1, y2,…, yp的协方差阵为Λ
性质1
性质2
由性质1和性质2可知,
p个主成分所反映的数据总差异等于原指标所反映的数据总差异。
协方差矩阵Λ的对角线上的元素之和等于特征根之和
第三十八页,讲稿共四十八页哦
贡献率和累计贡献率