1 / 28
文档名称:

主成分分析法96050.ppt

格式:ppt   页数:28页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析法96050.ppt

上传人:yzhlya 2016/4/20 文件大小:0 KB

下载得到文件列表

主成分分析法96050.ppt

文档介绍

文档介绍:主成分分析法概念: 把原来多个变量划为少数几个综合指标的一种统计分析方法,是一种降维处理技术. 主成分分析法一个研究对象,往往是多要素的复杂系统。变量太多无疑会增加分析问题的难度和复杂性,利用原变量之间的相关关系,用较少的新变量代替原来较多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这样问题就简单化了。研究对象要素 x 1 x 2… x j… x p 12…i…n x 11 x 12… x 1j … x 1p x 21 x 22… x 2j… x 2p ……………… x i1 x i2… x ij… x ip ……………… x n1 x n2 … x nj… x np 假设有 n个对象,每一个对象都有 x 1,x 2,…,x p个要素构成,它们所对应的要素数据用下表给出: 一、基本原理原变量为 x 1,x 2,…,x p,降维处理后,设它们的综合指标,即新变量为 z 1,z 2,z 3,…,z m (m ≤ p),则??????????????????? p mp m m m pp ppxlxlxlz xlxlxlz xlxlxlz ... ......... .......... .......... .......... ... ... 2211 22 22 1 21 2 12 12 1 11 1系数 l ij由以下原则确定 1、z i与z j (i≠j;i, j=1 ,2,…, m) 相互无关 2、z 1是x 1,x 2,…,x p的一切线性组合中方差最大者; z 2 是与 z 1不相关的 x 1,x 2,…,x p的所有线性组合中方差最大者; ………..;z m是与 z 1,z 2,z 3,…,z m-1 都不相关的 x 1,x 2,…,x p的所有线性组合中方差最大者。 z 1称为原变量 x 1,x 2,…,x p的第一主成分 Z 2称为原变量 x 1,x 2,…,x p的第二主成分…………….. z m称为原变量 x 1,x 2,…,x p的第 m主成分找主成分 z i就是要确定系数 l ij。从数学上知道, 它们分别是 x 1,x 2,…,x p的相关系数矩阵的m个较大的特征值所对应的特征向量。二、主成分分析的计算步骤??????????????????? nk nk j kj i ki nk j kji ki ijxxxx xxxxr 11 2 2 1相关系数计算公式 1、计算相关系数据公式得这 p个变量之间的相关系数矩阵为 pp pp p prrr rrr rrrR ... ... ... ... ... ... ... 21 2 22 21 1 12 11?分别求出对应于λ i的特征向量 e i (i=1 ,2,…, p) 2、计算特征值和特征向量解特征方程|λ E-R|=0 求出特征值λ i (i=1 ,2,…, p) 将这 P个特征值按大小顺序排列,即λ 1≥λ 2≥…≥λ p≥0 然后按公式| λ i E-R|e i =0 主成分 z i的贡献率为?? piQ i, , , ...21 p1k k i??????前i个主成分的累计贡献率为?? piQ pk k ik k, , , ...21 1 1???????? 3、计算主成分贡献率及累计贡献率当前 i个主成分累计贡献率达到 85% —— 95% ,就取前 i个主成分作为新变量。?? pjiel iji ij, , , , ...21???4、计算主成分载荷计算公式为得前 i个主成分在原变量上的载荷原变量 x i主成分 Z 1Z 2… Z i x 1x 2…x pl 11l 12…l 1pl 21l 22…l 2p………… l i1l i2…l ip