1 / 15
文档名称:

主成分分析.doc

格式:doc   大小:184KB   页数:15页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

主成分分析.doc

上传人:分享精品 2017/8/3 文件大小:184 KB

下载得到文件列表

主成分分析.doc

相关文档

文档介绍

文档介绍:什么是主成分分析法
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(ponents analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。
[编辑]
主成分分析的基本思想
在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令其中为正交阵的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。
例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。
[编辑]
主成分分析法的基本原理
主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Va(rF1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。[1]
[编辑]
主成分分析的主要作用
概括起来说,主成分分析主要由以下几个方面的作用。

最近更新

新人培育体系运作 59页

数据采样法插补原理 15页

数据库TPCC测试 15页

2022年河北省邯郸市鸡泽县物理八年级上册期末.. 14页

2022年江苏省泰州市数学八年级第一学期期末质.. 19页

2022年山东省惠民县数学八上期末教学质量检测.. 17页

2022年关于在创先争优活动中做好领导点评工作.. 3页

2022-2023学年黑龙江省大庆市第六十九中学物理.. 12页

2025年一级造价师之建设工程技术与计量(安装.. 223页

2025年一级造价师之建设工程技术与计量(安装.. 224页

2025年一级造价师之建设工程造价管理考试题库.. 169页

2025年一级造价师之建设工程造价管理考试题库.. 170页

2022-2023学年甘肃临夏和政县数学九年级上册期.. 19页

2022-2023学年湖南省邵阳市第十一中学九年级数.. 20页

2025年中级注册安全工程师之安全生产管理考试.. 200页

2025年中级银行从业资格之中级个人理财考试题.. 176页

2025年中级银行从业资格之中级个人理财考试题.. 176页

2022-2023学年海南省农垦中学物理八年级上册期.. 20页

2025年中级银行从业资格之中级个人理财考试题.. 176页

2025年二级建造师之二建建筑工程实务考试题库.. 163页

2025年二级建造师之二建建筑工程实务考试题库.. 163页

2025年二级建造师之二建建筑工程实务考试题库.. 162页

2025年二级建造师之二建建筑工程实务考试题库.. 162页

国家电网施工方案 3页

美国签证ds-160申请表信息-中文版 8页

人教版六年级上册数学期末模拟卷精品带答案 8页

一句一句教你念讨白 5页

宗喀巴大师《往生极乐愿文》提纲开示祈竹仁宝.. 13页

全国铁路车站代码 14页

2021年习姓的,姓习的名人 3页