1 / 70
文档名称:

管理统计 spass 第11章 主成分分析与因子分析..ppt

格式:ppt   页数:70页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

管理统计 spass 第11章 主成分分析与因子分析..ppt

上传人:分享精品 2016/5/3 文件大小:0 KB

下载得到文件列表

管理统计 spass 第11章 主成分分析与因子分析..ppt

相关文档

文档介绍

文档介绍:第11章主成分分析与因子分析在实际问题中,我们设计调查表,收集到大量指标(变量) 数据,但这些指标间通常不是相互独立,而是相关的。此时, 为了简化问题,我们就可以运用主成分分析法,在众多的指标中找出少数几个综合性指标,来反映原来指标所反映的主要信息(即,绝大部分的方差),实现简化问题的目的。例如,企业的利润、成本、市场占有率等是明显相关的; 某地区的企业数、 GDP 、物流量、信息量等也是明显相关的;一组青年中人的年龄、身高、肺活量等指标之间,通常也存在着相关性。对这些相关性较强的指标,可通过主成分分析法实现复杂问题的简单化。一、主成分分析基本概念主成分(ponents )分析是把给定的一组变量,通过线性变换,转化为一组不相关的变量。在这种变量的转化过程中,变量的总方差( 的方差之和)保持不变。同时,使具有最大方差,称为第一主成分; 具有次大方差,称为第二主成分。依次类推,原来有 k个变量,就可以转换出 k个主成分。但在实际应用中,为了简化问题,通常不是找出 k个主成分,而是找出 q(q<k )个主成分就够了,只要这 q个主成分反映出原来 k个变量的绝大部分的方差就行。 kXXX,,, 21?? kYYY,,, 21?? 1Y 2Y kXXX,,, 21??调查 n个个体(样本)在k个指标下的数值(或者用 k个指标来评价 n个对象),就可得到数据矩阵: n ? 2 1???????????? nk nn k kxxx xxx xxx????? 21 222 21 112 11 1X 2X kX?)(knX nk??统计描述现在的目的是要求解出, 使得即简记为 TkYYYY),,,( 21?? kkXaXaXaY 1212 1 11 1????? k kk kkkXaXaXaY????? 2211??????????????????????????????? k kk k k kX Xaa aaY Y?????? 1 1 1 11 1 AX Y??向量 Y 满足如下条件: ?指标之间不相关。?方差尽可能大,即对 n个对象的分辨率尽可能强,信息损失尽可能的少。 iY主成分分析小结: ( 1)从相关的多个指标中,求出相互独立的多个指标。 ( 2) 的方差信息不损失,尽可能等同于的方差。 X与Y的转换关系为: kXXX,,, 21?? kYYY,,, 21?? TkYYYY),,,( 21?? TkXXXX),,,( 21????????????????????????????????? k kk k k kX Xaa aaY Y?????? 1 1 1 11 1几何解释在下图的坐标中,散点大致为椭圆状。经过线性变换可以得到新的坐标。在椭圆的长轴上, 反映出了散点在这个方向的最大方差。在椭圆的短轴上,反映出了散点在这个方向的方差。 21XOX?? 21YOY?? 1Y 2Y1X 1Y 2X 2Y主成分的计算流程步骤一: 对矩阵而言(它是 k阶的实对称矩阵),首先找到它的 k个实特征根。步骤二: 相应的 k个长度为 1的、相互正交的特征向量, 即特征向量矩阵为式中, , 。???????????? kk k k kbb bbbbbB????? 1 1 11 21),,,( kbbb,,, 21? 1? jb kk TTI BB BB ???)(X COV T kjjjjbbbb),,,( 21??主成分的计算流程步骤三: 按如下方法得到主成分: 式中, 。是相互正交的综合变量。将 k个主成分放到一起可得矩阵表达式: iYXbYXbYXbY Tkk TT???,,, 2211? TkXXXX),,,( 21??),,1(kiY i??XBY T???????????????????????????????? k kk k k kX Xbb bbY Y?????? 1 1 1 11 1