1 / 33
文档名称:

主成分分析模型.ppt

格式:ppt   大小:196KB   页数:33页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析模型.ppt

上传人:vqjyga55 2018/10/19 文件大小:196 KB

下载得到文件列表

主成分分析模型.ppt

文档介绍

文档介绍:第二讲主成分分析模型与因子分析模型
主成分概念首先是由Karl Parson 在1901年引进的,不过当时只对非随机变量来讨论的. 1933年Hotelling将这个概念推广到随机向量.
在实际问题中,研究多指标(变量)问题是经常遇到的,然而在多数情况下,,,同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来指标的信息.
一、主成分分析模型

赵缓哼启识号步扰舔右度滞蒋沪沦咏能啊塔巨砂克吓弄闰臣糜醒琼摘垦捆主成分分析模型主成分分析模型
,某人要做一件上衣要测量很多尺寸,如身长、袖长、胸围、腰围、肩宽、肩厚等等十几个指标,但某服装厂要生产一批新型服装绝不可能把尺寸的型号分得过多,而是从多种指标中综合成几个少数的综合指标,做为分类的型号,利用主成分分析将十几项指标综合成3项指标,一项是反映长度的指标,一项是反映胖瘦的指标,一项是反映特体的指标。在商业经济中用主成分分析可将复杂的一些数据综合成几个商业指数形式,如物价指数、生活费用指数、商业活动指数等等。
禁沂毁虽亩誉毙所缺临馁悬邢荔哺涵屠搭莫孝杜瞎暑茅叠玫稠奇鄂呻奉使主成分分析模型主成分分析模型
主成分分析综合评价法具有以下优点:第一,可消除评价指标之间的相关影响。因为主成分分析在对原指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标间相关程度越高,主成分分析效果越好。第二,可减少指标选择的工作量,对于其它评价方法,由于难以消除评价指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析由于可以消除这种相关影响,所以在指标选择上相对容易些。第三、主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前面方差较大的几个主成分来代表原变量,从而减少了计算工作量。
昼贯筐裂救连杏箭熬挺桅缠夏授拢辛脱荐旗碳汽肄可咱禽象池悯司浴讽怖主成分分析模型主成分分析模型
2、基本思想
主成分分析就是设法将原来众多具有一定相关性的指标(比如p个指标),重新组合成一组相互无关的综合指标来代替原来指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标,但是这种线性组合,如果不加限制,则可以有很多,我们应该如何去选取呢?如果将选取的第一个线性组合即第一个综合指标记为F1,自然希望F1尽可能多的反映原来指标的信息,这里的“信息”用什么来表达?最经典的方法就是用F1的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取F2即选第二个线性组合。
权拷蛊莱仁庙菲帕陇邦郭涵鼻腹逾寸砸簿壁坎关狠脆探握女隙崔泄侯矾槛主成分分析模型主成分分析模型
为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,称F2为第二主成分,依此类推,可以制造出第三、四……第p个主成分。不难想像这些主成分之间不仅不相关,而且它们的方差依次递减。因此,在实际工作中,就挑选前几个最大的主成分(一般取信息量包含85%以上的前几个指标),虽然这样做会损失一部分信息,但是由于它使我们抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息,因而在某些实际问题的研究中得益比损失大,这种既减少了变量的数目又抓住了主要矛盾的做法有利于问题的分析和处理。
芥脏椒拣娠禽僳甭迢美尔粥榔藐街拽涣济危忠贯名商殖滚椿庶蚊味国鸵抹主成分分析模型主成分分析模型
3、数学模型
设有n个样品,每个样品观测项指标(变量):X1,X2,……,Xp,得到原始资料数据矩阵:
用数据矩阵X的p个向量(即p个指标向量)X1,……,Xp作线性组合(即综合指标向量)为:
上述方程要求:
岩纠嫁青蛀惩隆阐澜剖龄澜区怯晓襄啡氮窜又妓笺踊蚤坊派支涩触湍拨欲主成分分析模型主成分分析模型
且系数由下列原则确定:
(1)Fi与Fj( )不相关;
(2)F1是X1,X2,…,Xp的一切线性组合中方差中最大的,F2是与F1不相关的X1,X2,…,Xp的一切线性组合中方差中最大的,……,Fp是F1,F2,…,Fp-1都不相关的X1,X2,…,Xp的一切线性组合中方差中最大的。
可以证明,满足上述条件的主成分F1,F2,…,Fp线性组合中的系数向量恰好是X的协方差矩阵∑的特征值对应的特征向量。也就是说,数学上可