1 / 7
文档名称:

主成分分析Word文档.doc

格式:doc   大小:113KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析Word文档.doc

上传人:ipod0c 2018/10/8 文件大小:113 KB

下载得到文件列表

主成分分析Word文档.doc

相关文档

文档介绍

文档介绍:为了有效的地进行这种评价,我们希望寻找尽量少得m个综合特征值,这m(m<p)个综合特征值应包含p个变量的有关信息,并以这m个综合特征值对此同进行综合评价。显然,m越小,与之进行综合评价就越方便。称这样的方法为主成分分析(ponent Analysis,简称为PCA)。

基本原理
      首先,我们以包含两个变量的教学系统___两门课程的学****成绩为例。内容扩展
      
      设课程x1与x2时两门有一定相关性的课程,如:数学与物理。N名学生的学****成绩为:
                    (xi1,xi2) i=1~n                          (8—22)
       将这n组数据描在x1-x2平面上,(p=2的主成分)所示的图形。
       由于x1,x2是两门相关性的课程,学****成绩在x1-x2平面上分布集中在椭圆形的范围内(图a)。该椭圆是一种狭长形的椭圆,数据在长轴的方向上变化较大。从图可知,为了评价学生的成绩,x1,x2都是必需的,不能偏废某一个。
       由于x1,x2集中在一个狭长的范围内,我们可对这些数据作某种变化,将它变换到z1~z2平面上,则有图b。从图b可知,在z1~z2坐标中,z1,z2的相关性较小,且数据在Z1轴上的分散较大,在Z2轴上的分散较小。由于进行了这宗变幻,由Z1就能对学生的成绩进行综合评价,且Z1包含有X1,X2给出的信息。这样,经过一定的变换后,我们将以两个变量X1,X2评价学生成绩的系统,变换为主要由一个变量Z1对学生的成绩进行评价。此时,我们称Z1第一主成分。
       显然,若X1,X2不是相关的,X1,X2在 X1-X2 平面上的分布将是一种随机的均匀分布的图形(图c)。这些数据经Z变换后,在Z平面上的分布仍是一种均匀的分布,不可能找到上述的主成分。
      同样,对于P门课程的成绩,我们进行分析。内容扩展
      可用P维空间中的矢量:
            xi =(xi1,xi2,xip) i=1—n                   (8-23)
      来表示。
      式中,n为学生数,p为课程门数。若p门课程具有一定的相关性,通过某种变换,我们可以找到一种新的m维综合变量空间,且有m<p。在这个空间中,变量间的相关性较小。使用这种新的变量,可以做到,以较小的变量,对学生的成绩进行综合评价。
      主成分分析是一种将彼此相关的p个变量(特性)x1,x2,…xp所具有的信息,以满足以下两种条件:
      (1)Zk 与Zk'不相关(k≠k',k、k'=1、2…m)。
      (2)z1,z2,…zm的分散逐次减小,即
      z1的分散>z2的分散>…>zm的分散的m个综合特征值z1,z2,…zm(m<p)所表示的统计分析方法。在m个特征值中,我们称Zi(i=1—m)为第i主成分。
       主成分分析是一种进行信息压缩的方法。通过这种方法,可以将原来相关的若干变量,变换成不相关的变量。
返上
主成分分析的方法
       详细分析
      设p维空间的向量为:( 8-24)
      即总体中的