文档介绍:数学建模因子分析
*
第1页,本讲稿共69页
一、什么是因子分析
因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示9页
可取前两个因子F1和F2为公共因子,第一公因子F1物价就业因子,。第一公因子F2为投资因子,。共同度分别为1,,。
*
第18页,本讲稿共69页
假定原始变量已经作了标准化变换。
如果变量满足相关系数阵为
称 为约相关矩阵,由于是一个对角阵,所以 中对角线上的元素是共同度 ,而不是1,非对角向上的元素R与R*完全一样。
(二)当特殊因子 的方差不为零时(主因子法)
*
第19页,本讲稿共69页
如果特性方差是已知的,问题非常好解决,但通常
情况下,方差是未知的。所以我们要估计个性方差。
*
第20页,本讲稿共69页
(1) 个性方差矩阵 已知(主因子法)
R*=AA’=RX- ,我们在前面已经讨论了因子载荷矩阵A的列平方和是
称为Fj对所有的Xi的方差贡献,衡量Fj的相对重要性。因此我们希望先求出贡献大的因子,然后在依次求出贡献相对较小的因子。由因子模型可知R*=AA’
为R*=AA’中得元素
*
第21页,本讲稿共69页
设使S21最大的向量为 ,显然向量必须满足p2个约束条件,因此这是一个条件极值的问题,用拉格朗日乘数法由目标函数
可以证明,使目标函数T最大的 S21是R*=AA’的最大的特征根,其单位特征向量为r1 ,则
类推可以求的载荷矩阵的其他列。
*
第22页,本讲稿共69页
*
第23页,本讲稿共69页
*
第24页,本讲稿共69页
若 , 。而有非零特征根对应得特征向量分别为
*
第25页,本讲稿共69页
(2)在实际的应用中,个性方差矩阵一般都是未知的,可以通过一组样本来估计。估计的方法有如下几种:
首先,求 的初始估计值,构造出
1)取 ,在这个情况下主因子解与主成分解等价;
2)取 , 为xi与其他所有的原始变量xj的复相关系数的平方,即xi对其余的p-1个xj的回归方程的判定系数 ;
*
第26页,本讲稿共69页
3)取 ,这意味着取xi与其余的xj的简单相关系数的绝对值最大者;
4)取 ,其中要求该值为正数。
5)取 ,其中 是 的对角元素。
*
第27页,本讲稿共69页
假定某地固定资产投资率 ,通货膨胀率 ,失业率 ,相关系数矩阵为
试用主因子分析法求因子分析模型。假定用
代替初始的 。 。
*
第28页,本讲稿共69页
特征根为:
对应的非零特征向量为:
*
第29页,本讲稿共69页
*
第30页,本讲稿共69页
四、因子旋转(正交变换)
建立了因子分析数学目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义不清,则不便于进行实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。目的是使因子载荷阵的结构简化,使载荷矩阵每列或行的元素平方值向0和1两极分化。有三种主要的正交旋转法。四次方最大法、方差最大法和等量最大法。
(一)为什么要旋转因子
*
第31页,本讲稿共69页
百米跑成绩
跳远成绩
铅球成绩
跳高成绩
400米跑成绩
百米跨栏
铁饼成绩
撑杆跳远成绩
标枪成绩
1500米跑成绩
奥运会十项全能运动项目
得分数据的因子分析
*
第32页,本讲稿共69页
*
第33页,本讲稿共69页
因子载荷矩阵可以看出,除第一因子在所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太容易解释。似乎是跑和投掷的能力对比,似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子,得下表
*
第34页,本讲稿共69页
*
第35页,本讲稿共69页
通过旋转,因子有了较为明确的含义。 百米跑,
跳远和 400米跑,需要爆发力的项目在 有较大的载荷, 可以称