文档介绍:冯士雍研究员(统计学家)的一个关于“中国人体型分类与国家标准以及《服装号码》判定”的科研项目(1986-1990五年间,随机采访了15200人左右,得到了10622份有效数据(其中男生5115,女生5507))
表一上衣的8个人体部位尺寸的均值与标准差以及条件标准差
男生个体(5115)
部位
身高给定后的条件
身高和胸围给定后的条件
身高
----
----
颈椎点高
腰围高
坐姿颈椎点高
颈围
胸围
----
肩宽
臂长
表二身高和胸围给定后的条件期望
成年男子
颈椎点高
-+*身高+*胸围
腰围高
-+*身高-*胸围
坐姿颈椎点高
+*身高+*胸围
颈围
+*身高+*胸围
肩宽
+*身高+*胸围
臂长
-+*身高+*胸围
具体的主成分分析结果可见如下参考资料:
管宇编:《实用多元统计分析》[M],杭州:
表三 33个学生6门功课成绩的相关系数矩阵
古典语
法语
英语
数学
判别
音乐
古典语
1
法语
1
英语
1
数学
1
判别
1
音乐
1
斯皮尔曼()推测:总体协方差阵,也就是这6门功课成绩的协方差阵,应该有这样的结构:
记为:.每一门功课成绩都是由两部分构成。前一部分中的是对所有课程的考试成绩都有贡献的一个随机变量,后一部分中的
是仅对第i门课程考试成绩有贡献的一个随机变量。为此称为公共因子,而把称为特殊因子,并假设与相互独立,特殊因子间也相互独立。这就是因子分析的最初由来。
后记:现代教育理论认为,学生各科成绩的好坏主要是受每个学生的阅读理解能力、抽象思维能力、记忆能力和学习刻苦努力程度决定的。当然,学生成绩的好坏除了受制于上述4个公共因子影响之外,还可能受到其它特殊因子的影响。
总体来说,主成分分析主要是作为一种探索性的纯数学上的某种优化技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析通常和聚类、判别、回归分析等方法合用。主成分可以不需要实际意义,公共因子必须要能进行实际解释的。对因子进行命名解释是因子分析