文档介绍:第七章主成分分析与因子分析多元问题的复杂性:指标(变量)多,指标间存在相关性。问题∶能否构造出一些综合指标使满足如下条件∶①指标个数尽可能少,②指标间相互独立,③尽可能多地包含原指标所含的关于总体的信息。例如∶做一件上衣要测量的指标有∶身长、袖长、胸围、腰围、肩宽、肩厚等等十几项指标。某服装厂生产一批新型服装,需将十几项指标综合为3项指标(分别反应长度、胖瘦、特体),用作分类的型号。(主分量)分析是将原来众多具有相关性的指标化为少数几个相互独立的综合指标的一种统计方法。化高维为低维——降维化相关为独立——追源1、主成分的求法设为维随机向量,那么如何将这个指标综合成很少的几个指标且要尽可能反映原来指标的作用,又彼此不相关呢?一个自然的方法是寻找指标的一个综合指标——线性组合。我们先来考虑第一个综合指标其中是待定的常向量。现在的任务是选取适当的使得最大限度地反映原来指标用,这就相当于要求要有尽可能大的方差,即选取使得尽可能地大。说明是的无界函数。然而不能通过加大向量的长度使的方差变因为对任意的常数,有因此如果对不加大,即只要变长倍,相应的方差就扩大倍,也限制,问题就会变得毫无意义。一个自然的限制是令即要求是单位向量。问题变为:在的条件下,求使达到最大的。定理1设总体的均值和协方差阵分别为是总体的个指标,令其中,则使得的方差和达到最大的正好是矩阵的最大特征根所对应的特征向量。证明用Lagrange乘数法来证明。令则有令可得这样就有由于根据克莱姆法则知,上述齐次线性方程有非零解的充要条件是系数行列式为零,即这说明是矩阵的特征根,且由可知是对应于特征根的特征向量。又由可知欲使的方差最大,只要取为的最大特征根即可,这样就是对应的单位特征向量。第一个综合指标为其中是的对应于矩阵最大特征值的单位特征向量,称为第一主成分。若协方差矩阵即是非负定的,由矩阵论知它有个非负的特征根,不妨设为是对应的个特征向量。