文档介绍:第13章主成分分析和因子分析
由NordriDesign提供
【例】根据2008年一季度沪深两市农业板上市公司的9项主要指标数据,进行主成分分析,找出主成分并进行适当的解释
主成分分析 第13章主成分分析和因子分析
由NordriDesign提供
【例】根据2008年一季度沪深两市农业板上市公司的9项主要指标数据,进行主成分分析,找出主成分并进行适当的解释
主成分分析 (实例分析)
基本情况
公司成长性指标
公司盈利能力性指标
公司股本扩张能力指标
公司名称
ROA
主营收入增长率
净利润增长率
主营业务利润率
ROE
EPS
每股净资产
每股公积金
总资产增长率
禾嘉股份
0
亚盛集团
-
冠农股份
St中农
-
-
0
0
-
敦煌种业
-
-
新农开发
-
-
-
香梨股份
-
-
-
新赛股份
Stata的输出结果
estat smc
变量之间的存在较强的相关关系,适合作主成分分析
Stata的输出结果(选择主成分)
该表是选则主成分的主要依据
“Initial Eigenvalues”(初始特征根)
实际上就是本例中的9个主轴的长度
特征根反映了主成分对原始变量的影响程度,表示引入该主成分后可以解释原始变量的信息
特征根又叫方差,某个特征根占总特征根的比例称为主成分方差贡献率
设特征根为,则第i个主成分的方差贡献率为
比如,,占总特征根的的比例(方差贡献率)%,%的信息,可见第一个主成分对原来的9个变量解释的还不是很充分
根据什么选择主成分?
根据主成分贡献率
一般来说,主成分的累计方差贡献率达到80%以上的前几个主成分,都可以选作最后的主成分
%
根据特特征根的大小
一般情况下,当特征根小于1时,就不再选作主成分了,因为该主成分的解释力度还不如直接用原始变量解的释力度大
比如表中除前3个外,其他主成分的特征根都小于1。所以只选择了3个主成分
根据什么选择主成分?
Stata还提供了一个更为直观的图形工具来帮助选择主成分,即碎石图(Scree Plot)
从碎石图可以看到9个主轴长度变化的趋势
实践中,通常结合具体情况,选择碎石图中变化趋势出现拐点的前几个主成分作为原先变量的代表,该例中选择前3个主成分即可
根据什么选择主成分? (Scree Plot)
怎样解释主成分?
主成分的因子载荷矩阵
表1中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系数aij
比如,第一主成分所在列的系数-(ROA)之间的线性相关系数。这个系数越大,说明主成分对该变量的代表性就越大
载荷图(Loading Plot)直观显示主成分对原始9变量的解释情况
图中横轴表示第一个主成分与原始变量间的相关系数;纵轴表示第二个主成分与原始变量之间的相关系数
每一个变量对应的主成分载荷就对应坐标系中的一个点
第一个主成分很充分地解释了原始的后4个变量(与每个原始变量都有较强的正相关关系),第二个主成分则较好地var2,var3,var5,var6这2个变量(与它们的相关关系较高),而与其他变量的关系则较弱(相关系数的点靠近坐标轴)
怎样解释主成分? (Loading Plot)
因子分析