1 / 58
文档名称:

§6.主成分分析.ppt

格式:ppt   大小:1,033KB   页数:58页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

§6.主成分分析.ppt

上传人:416612240 2019/5/29 文件大小:1.01 MB

下载得到文件列表

§6.主成分分析.ppt

相关文档

文档介绍

文档介绍:*应用多元统计分析第六章主成分分析*在经济统计分析中,经济效益的综合评价、地区经济发展水平的评价、区域经济发展竞争力的评价、人民生活水平、生活质量的评价等。在这些问题研究中,一方面,为了避免遗漏重要信息,我们考虑尽可能多地引入研究变量,而另一方面,随着研究涉及变量的增多,变量之间的相关性造成信息重叠,势必增加了分析问题的复杂性。第六章主成分分析*主成分分析是研究如何将多个变量转化为少数几个综合变量(主成分)的一种统计降维技术。这种技术使得转化出来的综合变量既能够代表原始变量的绝大多数信息的同时,又互不相关。这就使得综合变量比原始变量具有更为优越的统计分析性能。第六章主成分分析*本章主要讨论:●主成分分析的基本理论●主成分分析的方法●主成分分析的计算步骤●主成分分析的软件实现应用分析第六章主成分分析*第一节主成分分析的基本理论本节基本内容一、主成分分析的基本思想二、数学表述三、主成分分析的几何解释*一、主成分分析的基本思想主成分概念首先是由皮尔逊(KarlParson)在1901年针对非随机变量引进,1933年霍特林(Hotelling)将这个概念推广到随机变量。主成分分析要做的是将原来众多具有一定相关性的变量,重新组合为一组新的相互无关的综合变量(主成分)来代替原始变量。*每个主成分是各原始变量的线性组合各个主成分之间互不相关主成分的数目大大小于原始变量的数目主成分保留了原始变量的绝大多数信息一、主成分分析的基本思想利用主成分分析得到的主成分和原始变量之间存在如下关系:*可以考虑如下构造主成分的思路:一、主成分分析的基本思想将选取的第一个线性组合即第一个综合变量记为,自然希望它尽可能多地反映原来变量的信息,这里“信息”用方差来测量,即越大,表示包含的信息越多。*因此,在所有的线性组合中所选取的应该是方差最大的,包含信息是最多的。如果第一个综合变量不足以代表原来个变量的信息,再考虑选取即第二个线性组合,为了有效地反映原来信息,已有的信息就不需要再出现在中,用数学语言表达就是要求,在这样的条件下,让达到最大。依此类推可构造出第三,四,……,第个综合变量。我们把这些综合变量称为主成分。一、主成分分析的基本思想*二、主成分分析的数学表述假设对某一事物的研究涉及个随机变量,其构成的维随机向量记为,并记随机向量的均值为,协差阵为。