1 / 65
文档名称:

第11章主成分分析和因子分析-精品.ppt

格式:ppt   大小:960KB   页数:65页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第11章主成分分析和因子分析-精品.ppt

上传人:落意心冢 2022/5/23 文件大小:960 KB

下载得到文件列表

第11章主成分分析和因子分析-精品.ppt

相关文档

文档介绍

文档介绍:第11章主成分分析和因子分析-精品
模型选择是艺术,而不是科学。




——大部分
在统计上,主成分所代表的原始变量的信息用其方差来表示。因此,所选择的第一个主成分是所有主成分中的方差最大者,即Var(yi)最大
如果第一个主成分不足以代表原来的个变量,在考虑选择第二个主成分,依次类推
这些主成分互不相关,且方差递减
主成分的选择
2019年8月
究竟选择几个主成分才合适呢?
一般要求所选主成分的方差总和占全部方差的80%以上就可以了。当然,这只是一个大体标准,具体选择几个要看实际情况
如果原来的变量之间的相关程度高,降维的效果就会好一些,所选的主成分就会少一些,如果原来的变量之间本身就不怎么相关,降维的效果自然就不好
不相关的变量就只能自己代表自己了
主成分的选择
2019年8月
主成分分析的步骤
主成分分析
2019年8月
对原来的p个指标进行标准化,以消除变量在水平和量纲上的影响
根据标准化后的数据矩阵求出相关系数矩阵
求出协方差矩阵的特征根和特征向量
确定主成分,并对各主成分所包含的信息给予适当的解释
主成分分析的步骤
2019年8月
【例】根据我国31个省市自治区2019年的6项主要经济指标数据,进行主成分分析,找出主成分并进行适当的解释
主成分分析 (实例分析)
31个地区的6项经济指标
2019年8月
第1步 选择【Analyze】下拉菜单,并选择【Data Reduction-
Factor】,进入主对话框
第2步 在主对话框中将所有原始变量选入【Variables】
第3步 点击【Descriptives】,在【correlation Matrix】下选择
【Coefficirnts】,点击【Continue】回到主对话框
第4步 点击【Extraction】,在【Display】下选择【Scree
Plot】,点击【Continue】回到主对话框
第5步 点击【Rotation】,在【Display】下选择【Loading
Plot】,点击【Continue】回到主对话框
点击【OK】
用SPSS进行主成分分析
用SPSS进行主成分分析
2019年8月
SPSS的输出结果
各变量之间的相关系数矩阵
变量之间的存在较强的相关关系,适合作主成分分析
2019年8月
SPSS的输出结果 (选择主成分)
各主成分所解释的原始变量的方差
该表是选则主成分的主要依据
2019年8月
“Initial Eigenvalues”(初始特征根)
实际上就是本例中的6个主轴的长度
特征根反映了主成分对原始变量的影响程度,表示引入该主成分后可以解释原始变量的信息
特征根又叫方差,某个特征根占总特征根的比例称为主成分方差贡献率
设特征根为,则第i个主成分的方差贡献率为
比如,,占总特征根的的比例(方差贡献率)%,%的信息,可见第一个主成分对原来的6个变量解释的已经很充分了
根据什么选择主成分?
2019年8月
根据主成分贡献率
一般来说,主成分的累计方差贡献率达到80%以上的前几个主成分,都可以选作最后的主成分
%
根据特特征根的大小
一般情况下,当特征根小于1时,就不再选作主成分了,因为该主成分的解释力度还不如直接用原始变量解的释力度大
,其他主成分的特征根都小于1。所以SPSS只选择了两个主成分
就本例而言,两个主成分就足以说明各地区的经济发展状况了
根据什么选择主成分?
2019年8月
SPSS还提供了一个更为直观的图形工具来帮助选择主成分,即碎石图(Scree Plot)
从碎石图可以看到6个主轴长度变化的趋势
实践中,通常结合具体情况,选择碎石图中变化趋势出现拐点的前几个主成分作为原先变量的代表,该例中选择前两个主成分即可
根据什么选择主成分? (Scree Plot)
拐点
2019年8月
怎样解释主成分?
主成分的因子载荷矩阵
表1中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系数aij
比如,(人均GDP)之间