文档介绍:: .
《统计手册:金融中的统计方法》
第 16 章 主成分分析和因子分析
Rao
主成分分析和因子分析(principal component and factor analysis,PCA 和 FA)是用于研究
个体测量指标的协方差(或相关)结构的探索性多元技术。分析的目标可以不同:找出若干
可以解释可观测指标之间的变差或者联系的潜变量而简化高维数据,对相似指标进行分组及
检测多重共线性,将高维数据在低维空间中图示以直观考察数据的散布情况及检测异常值。
PCA 是由 Pearson(1901)和 Hotelling(1933)发展起来的;Rao(1964)给出了基本原理
及一些扩展和运用。FA 首先由 Spearman(1904)提出,接着Lawley(1940)在多元正态性
的假定下发展。Rao(1955)给出了没有任何分布假设的 FA 的原理,命名为典型因子分析
(CFA)。现在已经有许多优秀的、大部的专著致力于社会科学和自然科学研究中 PCA 和 FA
的计算及使用问题。参考文献包括Bartholomew(1987),Basilevsky(1994),Cattel(1978),
Jackson(1991),和 Jolliffe(1986),这里仅提到少数作者。
当测量指标是定性指标时,和PCA 有关的一种方法称为对应分析(correspondence
analysis,CA),是 Benzecri(1973)基于 Fisher(1936)提出的定性尺度范畴(scaling qualitative
categories)方法而发展起来的。Greenacre(1984)的专著阐述了CA 的理论及其在列联表分
析中的应用。Rao(1995)的论文包含了 CA 的一种替代方法,和 CA 的用途一致,但看起
来优于早期方法。
本文将提供某些最新理论成果和实际应用以全面考察 PCA 和 FA。
主成分问题可以用如下非常一般的步骤进行阐述。令x 是一个 p 维向量, y 是一个q 维
向量,其中x 和 y 的一些分量可能是相同的。我们要用z = Ay代替 y ,其中 A是一个r × q
矩阵且r < q ,使得用 z 代替 y 预测 x 的损失尽可能小。如果
⎛Σ11 Σ12 ⎞
⎜⎜⎜⎜ ⎟⎟⎟⎟ ()
⎝Σ21 Σ22 ⎠