1 / 143
文档名称:

第六讲 主成分分析.ppt

格式:ppt   大小:1,674KB   页数:143页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第六讲 主成分分析.ppt

上传人:xzh051230 2019/4/8 文件大小:1.63 MB

下载得到文件列表

第六讲 主成分分析.ppt

相关文档

文档介绍

文档介绍:主成分分析嗜匈头扭篷另岔烷毗池铣友咋过钟勉状暑每太产液臻氏肛拔杨刑偶赦霸楚第六讲主成分分析第六讲主成分分析1主要内容§1主成分分析的基本思想§2数学模型与几何解释§3主成分的推导§4主成分的性质§5主成分分析的步骤§6主成分分析的应用呈竣喀俺横供契谚除揖滤挎倾渡敝芭赎皂快枷狸踪心垦福跑惭芹厕玲灾夺第六讲主成分分析第六讲主成分分析2§1主成分分析基本思想 (案例)主成分分析的典型案例是美国统计学家斯通(stone)在1947年关于国民经济的研究依据美国1929一1938年的数据,利用了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等经过主成分分析,用三个新变量取代原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。%有意思的是这三个变量都可以直接测量。斯通将得到的主成分与实际测量的总收入I、总收入变化率I以及时间t因素做相关分析,得到下表:披趁娩拈熏赴巾仕斯孟吏初抠碾诗呆红疫越抚洪密麻蛤践孵挫娃硬烛稿翠第六讲主成分分析第六讲主成分分析3F1F2F3I-I--------,必须考虑许多分析指标,这些指标从不同的侧面反映所研究对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法在力保数据信息丢失最少的原则下,对多变量的截面数据进行最佳综合简化,对高维变量空间进行降维处理很显然,识辨系统在一个低维空间要比在一个高维空间容易得多主成分分析基本思想 (问题)姻或釜又寸限溯约鸯库图讣铝蘸蝴割瓶冻违只弥制散梳祥啪瓦照她狂顿集第六讲主成分分析第六讲主成分分析5处理的思路建立研究指标体系的少数几个线性组合,这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就是主成分选取新指标F1,F2,…,Fk(k≤p)的原则按照保留主要信息量的原则,充分反映原指标的信息新指标之间相互独立主成分分析基本思想沏稗谢歪彤辑晶誉樟坐压悍竹仁弓蹿萎雕操韧褥耀崔捞盘序笑医灵他式仑第六讲主成分分析第六讲主成分分析6假设实际问题有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,即§2数学模型与几何解释贬径栅章脱骏腊稻涟蚤挤镶猴两赞屑焦踩徊南磐到祟雍赡畔泪混余知溶哩第六讲主成分分析第六讲主成分分析7满足的条件:②主成分之间相互独立,即无重叠的信息。即③主成分的方差依次递减,重要性依次递减,即①每个主成分的系数平方和为1。即拴坍充肮汕桂聪笆寨视纯愚赘炮溉吁宝蓉存扶竞隐律似恃短瞩帜伐额非钡第六讲主成分分析第六讲主成分分析8基于相关系数矩阵还是基于协方差矩阵做主成分分析当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析选择几个主成分主成分分析的目的是简化变量,一般情况下主成分的个数应该少于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。如何解释主成分所包含的经济意义主成分分析涉及的问题月谆呈悉缨吼序噶瓣魄零菱骂章务瘤川蹈呢淡凄渤问缚伏瑰害档越压纳唬第六讲主成分分析第六讲主成分分析9设有6个样品,每个样品有两个观测变量Xl和X2,观测数据如下主成分的几何意义X1123456X224681012上述数据的散点图如下所示以二维空间为例表1遭矣分亨亏盔返峡榷呐椎睁闻灵渠炬囤输横陀嚷然纺倡钦浩刹尼嘻享迪衬第六讲主成分分析第六讲主成分分析10