1 / 54
文档名称:

第七章主成分分析.pptx

格式:pptx   大小:810KB   页数:54页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第七章主成分分析.pptx

上传人:wz_198613 2019/4/17 文件大小:810 KB

下载得到文件列表

第七章主成分分析.pptx

文档介绍

文档介绍:§(或称主分量分析,ponentanalysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。主成分分析的一般目的是: (1)变量的降维; (2)主成分的解释。寻找主成分的正交旋转旋转公式:§、主成分的定义及导出二、主成分的性质三、从相关阵出发求主成分一、主成分的定义及导出设为一个p维随机向量,E(x)=μ,V(x)=Σ。考虑如下的线性变换 希望在约束条件下寻求向量a1,使得达到最大,y1就称为第一主成分。设λ1≥λ2≥⋯≥λp≥0为Σ的特征值, ,i=1,2,⋯,p为相应的单位特征向量,且相互正交。则可求得第一主成分为 它的方差具有最大值λ1。如果第一主成分所含信息不够多,还不足以代表原始的p个变量,则需考虑再使用一个综合变量,为使y2所含的信息与y1不重叠,应要求Cov(y1,y2)=0 我们在此条件和约束条件下寻求向量a2,使得达到最大,所求的称为第二主成分。求得的第二主成分为其方差为λ2。 一般来说,x的第i主成分是指:在约束条件和Cov(yk,yi)=0,k=1,2,⋯,i−1下寻求ai,使得 达到最大。第i主成分为主成分的几何意义在几何上,ti表明了第i主成分的方向,yi是x在ti上的投影值(其绝对值即为投影长度),λi是这些值的方差,它反映了在ti上投影点的分散程度。x投影到ti上的值其中𝛉i是ti与x的夹角。主成分向量与原始向量之间的关系式主成分与原始变量之间的关系式矩阵y1y2⋯ypx1t11t12⋯t1px2t21t22⋯t2p⋮⋮⋮⋮xptp1tp2⋯tpp