1 / 55
文档名称:

统计分析与方法-第八章 主成分与因子分析.ppt

格式:ppt   大小:1,787KB   页数:55页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

统计分析与方法-第八章 主成分与因子分析.ppt

上传人:分享精品 2017/7/27 文件大小:1.75 MB

下载得到文件列表

统计分析与方法-第八章 主成分与因子分析.ppt

相关文档

文档介绍

文档介绍:主成分分析和因子分析
主成分与因子分析
3
主成分与因子分析
好裁缝做上衣,要测量上体长、手臂长、胸围等 14 个指标。用流水线生产上衣时要测量每个顾客的 14 个指标是不可能的。
于是统计学家出了个主意:这 14 个指标是相关的,可以找出几个反映上衣特征的综合指标,加工出的上衣大多数人都能穿,当然特体除外。
4
主成分与因子分析
结果统计学家成功了!
这两个不相关的指标就是上衣的型和号。
本章的教学目的就是教会学生如何建立和使用降维模型。
主成分分析
每个人都会遇到有很多变量的数据。
比如全国或各个地区的带有许多经济和社会变量的数据;各个学校的研究、教学等各种变量的数据等等。
这些数据的共同特点是变量很多,在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。
主成分分析和因子分析
本章就介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(ponent analysis)和因子分析(factor analysis)。实际上主成分分析可以说是因子分析的一个特例。在引进主成分分析之前,先看下面的例子。
成绩数据()
100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。
从本例可能提出的问题
目前的问题是,能不能把这个数据的6个变量用一两个综合变量来表示呢?
这一两个综合变量包含有多少原来的信息呢?
能不能利用找到的综合变量来对学生排序呢?这一类数据所涉及的问题可以推广到对企业,对学校进行分析、排序、判别和分类等问题。
主成分分析
例中的的数据点是六维的;也就是说,每个观测值是6维空间中的一个点。我们希望把6维空间用低维空间表示。
先假定只有二维,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值;如果这些数据形成一个椭圆形状的点阵(这在变量的二维正态的假定下是可能的)
10