1 / 4
文档名称:

主成分分析模板.doc

格式:doc   大小:146KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析模板.doc

上传人:ttteee8 2019/11/21 文件大小:146 KB

下载得到文件列表

主成分分析模板.doc

文档介绍

文档介绍::..主成分分析的主要目的是希望用较少的变量去解释原來资料中的大部分变异,将我们手屮许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的儿个新变量,即所谓主成分,并用以解释资料的综合性指标。这些综合指标取原来变最指标的线性组合,并适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为Xi,X2,…,X"它们的综合指标 新变量指标为Zi,Z2,…,zm(mWp)。贝U・<5=厶“+?22丕+…円2pXp式中,系数I。由下列原则來决定:(1)对于每一个i,都有吆+厲+…+Ep=1(2)zi与Zj(iHj;i,j=l,2,…,m)相互无关;(3)Z]是Xi,X2,…,Xp的一切线性组合中方差最大者;Z2是与Z1不相关的X1,X2,…,Xp的所有线性组合小方差最大者;……;Zm是与Z|,Z2,……Zn"都不相关的旳,X2,…,Xp的所有线性组合中方差最大者。这样决定的新变量指标Z[,Z2,…,zm分别称为原变量指标X”X2,…,Xp的第一,笫二,…,第m主成分。Z1在总方差中占的比例最大,Z2,Z3,…,Zm的方差依次递减。在实际问题的分析中,常挑选前儿个最大的主成分,这样既减少了变量的数冃,又抓住了主要矛盾,简化了变量之间的关系。二、主成分分析的计算步骤通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:(1)计算相关系数矩阵PP在公式(3)屮,m(i,j=l,2,…,p)为原來变量Xi与x:的相关系数,其计算公式为因为R是实对称矩阵(即□二口),所以只需计算其上三角元素或下三角元素即可。(2)计算特征值与特征向量首先解特征方程丨XI-R|二0求出特征值「(i二1,2,…,p),并使其按大小顺序排列,即入“入2上…,印30;然后分别求出对应于特征值入i的特征向量(i二1,2,…,p)。(2)计算主成分贡献率及累计贡献率p m P主成分s贞献率:刁/£%(,=1,2,…,p),累计贞献率:£九/£%。1=1 *=1 k=\一般取累计贡献率达85-95%的特征值・,入2,…,♦所对应的第一,第二, ,第m(mWp)个主成分。(3)计算主成分载荷由此可以进一步计算主成分得分:‘5Z12 •…^lmZ=V^21^22•…Sn(6)••••••••••••、乙1乙2 •…71)首先将表2-14屮的原始数据作标准化处理,由公式(4)计算得相关系数矩阵(见表2-15)o(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表2-16)o由表2T6可知,第一,第二,%,故只需求出第一,第二,第三第五主成分乙,Z2,乙即可。第一种序号特征根贡献率%累计贡献率%(4) 对于特征值九1=,入2=1」332,,^=,九3=