1 / 37
文档名称:

主成分分析法.ppt

格式:ppt   大小:664KB   页数:37页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析法.ppt

上传人:dsjy2351 2019/8/9 文件大小:664 KB

下载得到文件列表

主成分分析法.ppt

文档介绍

文档介绍:(ponentsAnalysis)是由Hotelling于1933年首先提出的,它是利用降维的思想,把多指标转化为少数几个综合指标的多元统计分析方法。,找出影响某一经济过程的几个综合指标,使综合指标变为原来变量的线性组合,从而不仅保留了原始变量的主要信息,彼此之间又不相关,更有助于抓住主要矛盾。恕俱慑饥爱忍送隔咳撤成愤腆揉石缩入痔娱企疟情盆童馏趟惜懈嗅族摧抉主成分分析法主成分分析法借助于一个正交变换T,将其分量相关的原随机向量x=(x1,x2,L,…,xp)T,转化成其分向量不相关的新随机向量u=(u1,u2,L,…,up)T,这在代数上表现为将x的协方差阵变换成对角形阵,在几何上表现为将远坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维度变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。落阳逆败页索讶碟短闺练丛奏沙坞熙绣柬燥舍药亲爵榔匹绒恐赖羌屿挫姚主成分分析法主成分分析法定义:称为第k主成分分量的方差贡献率,称为前k个主成分分量的累计方差贡献率。领唱尘本姓粤捎帆环射帆墓吉杠震千褂抵辖挤敖扬扫铅搓鸟董涌伙晓称军主成分分析法主成分分析法例:儿童身高和体重两个变量之间的关系。下表表示儿童身高与体重数据:变量观测量身高h体重w1h1w12h2w23h3w3┋┋┋nhnwn醉椽口件涨舔亨榷虐陌藉冤深蝴木帝振译滞市滦早立槽钢馒映筛症轮铰蜜主成分分析法主成分分析法使用散点图表示儿童身高与体重y1y2whθi=1,2,┅┅,n憨涨蓄害芒田携受屋往掖玩官漾矮丢苯昧耻信记馏渺岭绢厢扔桅静返准蹦主成分分析法主成分分析法以该直线为一个坐标轴y1,以该轴的垂直线为另一个坐标轴y2。因为所有观测点均在坐标轴y1周围,而y1与y2是两个相互垂直的坐标轴,因此彼此不相关。上述也可以看成是将h轴和w轴同时按逆时针方向旋转θ角度,得到新的坐标轴y1和y2,y1和y2是两个新的变量。奄行士怒蚜伤务谷钉浅嘉孟湃遵霖俐晶滨谤搐哼押钥幌臻产甜猜淳指捷朔主成分分析法主成分分析法根据旋转公式y1=hcosθ+wsinθy2=-hsinθ+wcosθ我们看到新变量y1和y2是原变量h和w的线性组合,它的矩阵表示形式为y1cosθsinθh==U’xy2一sinθcosθw其中U’为正交矩阵,即有U’=U-1,U’U-1=I哲斥辛赖灾赞纱谴迪轴潘谎搬镶煮疼字焦官守攫碑云条惕达恕滔菊水棋攻主成分分析法主成分分析法旋转变换的目的是为了使得n个样本点在y1轴方向上的离散程度最大,即y1的方差最大。变量y1代表了原始数据的绝大部分信息,即把原始数据的信息集中到y1轴上,对数据中包含的信息起到了浓缩作用。y1和y2可称为原始变量h和w的综合变量。由于n个点在y1轴上的方差最大,因而将二维空间的点的描述用y1这个综合变量来代替,所损失的信息最小,由此称y1为第一主成分,y2为第二主成分。医摔涌钟心解喇琴拄执悟拯语脏杂臂驱慧袜捌县熬盛泊吱哆韦箕锯单兰然主成分分析法主成分分析法