1 / 63
文档名称:

主成分和因子分析方法及应用1.ppt

格式:ppt   大小:689KB   页数:63页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分和因子分析方法及应用1.ppt

上传人:薄荷牛奶 2017/8/8 文件大小:689 KB

下载得到文件列表

主成分和因子分析方法及应用1.ppt

相关文档

文档介绍

文档介绍:第六章主成分与因子分析方法及其应用
现实系统是多要素的复杂系统,在研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。
问题的提出:
工作者掌握了大量数据,但掌握不了数据之间错综复杂的关系,而且指标多会增加分析问题的复杂性,只好从各个不同的角度对这些数据进行删简或加以强调,这样就不可避免地给解释工作和成因分析带来不同程度的片面性,造成各人的解释和成因分析有很大的出入。
人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?
能否通过某些线性组合,使原始变量减少为有代表意义的少数几个新的变量,以少数几个指标或“成分”来代表多数指标?这是对系统进行分析的关键问题。
一、主成分分析方法
主成分分析是把原来多个变量转化为少数几个综合指标的一种统计分析方法。
从数学角度来看,这是一种降维处理技术。它能够从大量的观测资料中,在关系复杂的情况下,找到影响它们的共同因素和特殊因素。用主成分去代替原始变量时,不仅对原始变量中的相关信息损失无几,而且较原始变量更集中更典型地表明现象的内在联系。
(一)主成分分析的基本原理及数学模型
假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵
其中:i=1,2,…,n j=1,2,…,p
如果原来单项指标记为
它们的综合指标记为
特别当p=2时,原指标是
设n个散布点大致为一个椭圆形,如图
若在椭圆长轴方向取坐标z1,在椭圆短轴方向取坐标z2,这相当于在平面上作了一个坐标变换
变换后的坐标有下述性质:
①n个点的坐标z1和z2的相关几乎为0。
②二维平面上的n个点的波动(方差)大部分可以归结为z1轴上的波动,而z2轴上的波动是较小的。
于是称z1和z2是原指标x1和x2的主要成分。如图中的椭圆是相当扁平的,则可以考虑z1方向上的波动,忽视z2方向上的波动,这样不会犯很大的错误。比如,这个椭圆的长轴方向反映整个信息的75%,那么仅用z1来表示x1和x2还是可以的,这样二维就可以降为一维了,z1就是x1和x2的综合指标。显然
这里的L11和L12可以理解为x1和x2对z1这个综合指标的权值,也可以理解为变量x1和x2的回归系数。