1 / 8
文档名称:

主成分分析法..doc

格式:doc   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析法..doc

上传人:分享精品 2016/3/27 文件大小:0 KB

下载得到文件列表

主成分分析法..doc

相关文档

文档介绍

文档介绍:主成分分析法一、主成分分析( ponents analysis )也称为主分量分析,是由 Holtelling 于 1933 年首先提出的。主成分分析是利用降维的思想,把多指标转化为少数几个综合指标的多元统计分析方法。二、应用背景: 对同一个体进行多项观察时,必定涉及多个随机变量 X1 , X2 , …, Xp ,它们都是相关的, 一时难以综合。这时就需要借助主成分分析(ponent analysis) 来概括诸多信息的主要方面。我们希望有一个或几个较好的综合指标来概括信息,而且希望综合指标互相独立地各代表某一方面的性质。任何一个度量指标的好坏除了可靠、真实之外,还必须能充分反映个体间的变异。如果有一项指标,不同个体的取值都大同小异,那么该指标不能用来区分不同的个体。由这一点来看,一项指标在个体间的变异越大越好。因此我们把“变异大”作为“好”的标准来寻求综合指标。例1、考察对象股票业绩( 这里单个股票为观察个体)。( 1) 确定影响股票业绩主要因素:主营业务收入( X1 ),主营业务利润( X2 ) 利润总额( X3 ),净利润( X4 ),总资产( X5 ),净资产( X6 ),净资产收益率( X7 ), 每股权益( X8 ) ,每股收益( X9 ) ,每股公积金( X10 ) ,速动比率( X11 )作为变量。因此对单个股票来说,用 11 个随机变量综合刻化。但这些因素过多,各因素区别不明显,有交叉反映。通过主成分分析,可降为少数几个综合指标加以刻化。( 2)考察 20支不同的股票。从数学角度看,每种影响因素是随机变量( X i), 观察一支股票便得到影响该股票的 11个随机变量取值;观察 20支股票,便得到了 20×11的原始数据阵 X20 × 11(略)。三、问题:作为主成分?严格的数学定义?相应的性质有哪些?主成分取多少? 1 、主成分的一般定义设有随机变量 X1,X2,…,Xp,其样本均数记为 1X , 2X ,…, pX ,样本标准差记为 S1,S2,…,Sp。首先作标准化变换 S XXx ??我们有如下的定义: (1) 若Y1=a11x1+a12x2+ …+a1pxp ,1 21 2 12 2 11???? paaa?,且使 Var( Y1) 最大,则称 Y1为第一主成分; (2) 若Y2=a21x1+a22x2+ …+a2pxp ,1 22 2 22 2 21???? paaa?,(a21 ,a22 ,…, a2p) 垂直于(a11 ,a12 ,…,a1p) ,且使 Var( Y2)最大,则称 Y2为第二主成分; (3) 类似地,可有第三、四、五…主成分,至多有 p个。 2 、主成分的性质:Y1,Y2,…,Yp具有如下几个性质(1) 主成分间互不相关,即对任意 i和j,Yi和Yj的相关系数 Corr( Yi,Yj)=0 i ?j (2) 组合系数(ai1 ,ai2 ,…,aip) 构成的向量为单位向量, 1 222 21???? ip iiaaa?(3) 各主成分的方差是依次递减的, 即 Var( Y1)≥Var( Y2)≥…≥Var( Yp) (4) 总方差不增不减, 即 Var( Y1)+Var( Y2)+ …+Var( Yp) =Var(x1)+Var(x2)+ …+Var(xp) 这一性质说明: 主成分是原变量的线性组合,