1 / 13
文档名称:

R语言多元分析系列.doc

格式:doc   大小:24KB   页数:13页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

R语言多元分析系列.doc

上传人:wz_198614 2017/9/29 文件大小:24 KB

下载得到文件列表

R语言多元分析系列.doc

相关文档

文档介绍

文档介绍:R语言多元分析系列
主成分分析(ponents analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是在处理观测数目小于变量数目时无法发挥作用,例如基因数据。
p函数,将结果输入到summary和plot函数中可分别得到分析结果和碎石图。但psych扩展包更具灵活性。
1 选择主成分个数
选择主成分个数通常有如下几种评判标准:
?
?
? 根据经验与理论进行选择根据累积方差贡献率,例如选择使累积方差贡献率达到80%的主成分个数。根据相关系数矩阵的特征值,选择特征值大于1的主成分。
另一种较为先进的方法是平行分析(parallel analysis)。该方法首先生成若干组与原始数据结构相同的随机矩阵,求出其特征值并进行平均,然后和真实数据的特征值进行比对,根据交叉点的位置来选择主成分个数。
我们选择USJudgeRatings数据集举例,首先加载psych包,,从图中可见第一主成分位于红线上方,第二主成分位于红线下方,因此主成分数目选择1。
([,-1], fa="pc",=100, =FALSE)
2 提取主成分 pc=principal([,-1],=1)
PC1 h2 u2
1
2
3
4
5
6
7
8
9
10
11
PC1
SS loadings
Proportion Var
从上面的结果观察到,PC1即观测变量与主成分之间的相关系数,h2
是变量能被主成分解释的比例,u2则是不能解释的比例。主成分解释了92%的总方差。p函数结果不同,p函数返回的是主成分的线性组合系数,而principal函数返回原始变量与主成分之间的相关系数,这样就和因子分析的结果意义相一致。
3 旋转主成分
旋转是在保持累积方差贡献率不变条件下,将主成分负荷进行变换,以方便解释。成分旋转这后各成分的方差贡献率将重新分配,此时就不可再称之为“主成分”而仅仅是“成分”。旋转又可分为正交旋转和斜交旋转。正交旋转的流行方法是方差最大化,需要在principal中增加rotate='varimax'参数加以实现。也有观点认为主成分分析一般不需要进行旋转。
4 计算主成分得分
主成分得分是各变量的线性组合,在计算出主成分得分之后,还可以将其进行回归等做进一步分析处理。但注意如果输入数据不是原始数据时,则无法计算主成分得分。我们需要在principal中增加score=T的参数设置,结果将存放在结果的score元素中。
探索性因子分析(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而EFA能够将具有错综复杂关系的变量综合为少数几个核心因子。EFA和PCA的区别在于:PCA中的主成分是原始变量的线性组合,而EFA中的原始变量是公共因子的线性组合,因子是影响变量的潜在变量,变量中不能被因子所解释的部分称为误差,因子和误差均不能直接观察到。进行EFA需要大量的样本,一般经验认为如何估计因子的数目为
N,则需要有5N到10N的样本数目。
虽然EFA和PCA有本质上的区别,但在分析流程上有相似之处。,其变量是对人的六种能力,例如阅读和拼写能力进行了测验,其数据是一个协方差矩阵而非原始数据。R语言中stats包中的factanal函数可以完成这项工作,但这里我们使用更为灵活的psych包。
一、选择因子个数
一般选择因子个数可以根据相关系数矩阵的特征值,特征值大于0则可选择做为因子。我们仍使用平行分析法(parallel analysis)。该方法首先生成若干组与原始数据结构相同的随机矩

最近更新

学校班主任教师教学工作总结 3页

学校特色工作总结 3页

一种web实体建模方法的设计与实现的中期报告 2页

一款多功能移动终端用电源管理IC设计的中期报.. 2页

一些由拉普拉斯谱确定的图的中期报告 1页

厨房燃气灶具正确使用方法 27页

管理信息系统2管理信息系统的计算机网络技术基.. 31页

纺织品生产的安全管理与防护技术 31页

学校校长竞聘演讲稿模板汇编9篇(全文共15763字.. 3页

学校校长工作计划三篇 13页

《说文》饮食器具类词研究的中期报告 1页

北师大版语文第十册《心愿》ppt课件 27页

2023年初中应用物理知识竞赛试题 47页

2023年党员领导干部廉政知识竞赛判断题库120题.. 13页

北师大版六年级下册整册教案《我站在铁索桥上.. 28页

北师大版二年级下册《女娲补天》教案 24页

精选工作计划之.血透室的学习计划 8页

2022年安徽省合肥市庐阳区九年级阶段调研二模.. 3页

2022-2023年校园安全知识竞赛自测卷(含答案) 3页

北京版二年级上册《方字歌》PPT课件 25页

北京版一年级下册《能干的保姆》PPT课件 28页

办公室主任安全工作职责 27页

《执行力培训》课件 30页

人工智能在文物保护中的应用 24页

数字化文物修复与保护技术 29页

2023年山东省济南市槐荫区中考一模物理试题(含.. 3页

u型桥台与肋板台辨别三维透视图 4页

扩建项目危险品仓库钢结构施工组织设计 34页

苏教版数学一年级下册 《元、角、分》说课稿 3页

篮球课运球传球教案 6页