文档介绍:统计1042班 刘百武101001404246
因子分析方法
----在农业上的运用
一、因子分析的原理及数学模型
因子分析的基本思想是根据相关性大小把变量分组, 使得同组内的变量之间相关性较高, 但不同组的变量相关性较低。每组变量代表一个基本结构, 称为公共因子。对于所研究的问题就可试图用最少个数的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一变量。
1、因子分析的步骤
1. 对原始数据进行预处理。
2. 求矩阵R 及特征值和特征向量。
3. 建立因子模型。
4. 确定因子贡献率及累积贡献率。
5. 因子载荷矩阵的变换。
6. 计算总得分值。根据主因子和综合因子得分情况给出相应的评价
1. 对原始数据进行预处理。
常见的是将数据进行标准化处理
一、Min-max 标准化
min-max标准化方法是对原始数据进行线性变换。
设minA和maxA分别为属性A的最小值和最大值,将A的一个原始值x
通过min-max标准化映射成在区间[0,1]中的值x',其公式为:新数据=(原数据-极小值)/(极大值-极小值)
二、z-score 标准化
这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将A的原始值x
使用z-score标准化到x'。
z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
新数据=(原数据-均值)/标准差
spss默认的标准化方法就是z-score标准化。
2. 求矩阵R 及特征值和特征向量。
设相关矩阵为R= XX’( 假定标准化后的矩阵仍记为X) , 标准特征方程| R- KI| = 0, 求出相关矩阵R 的特征向量矩阵A 和特征值K1> K2> ,> Kp≥0, 并使F= AX’, 其中F 为主因子阵。
3. 建立因子模型。
模型为: X= AF+ e, A1 称为因子载荷矩阵。F1 称为主因子, e 称为特殊因子。因子模型可具体写成:
x1= a11f1+ a12f2+ ,+ a1mfm+ a1e1
x2= a21f2+ a22f2+ ,+ a2mfm+ a2e2
,,
xp= ap1+ ap2f2+ ,+ apmfm+ apep
式中, f1, f2, ,, fm 为主要因子, 分别反映某一方面信息的不可观测的潜在变量; aij为因子载荷系数, 若某指标在某因子中作用大, 则该因子的载荷系数绝对值就大, 反之亦然; ei 为特殊因子, 实际建模中可忽略。
5. 因子载荷矩阵的变换。
正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。
4. 确定因子贡献率及累积贡献率。
第i 个因子的贡献率为:
di=
公因子提取的个数一般由公因子方差的累计贡献率和数值大于1 的公因子两个条件决定,即提取前m 个大于1 的公因子,使得方差的累计贡献率≥85%,这样既可使损失信息不多,又便于对实际问题
6. 计算总得分值。根据主因子和综合因子得分情况给出相应的评价
通过旋转和计算, 得到新的较为理想的因子载荷阵和因子得分系数矩阵。每一个单位得分总值由下式计算:
式中f ij为第i 个单位第j 个因子得分, dj 为第j 个因子贡献率, 作为权重。
这样计算的结果, 避免了主观确定权数, 而从信息量和系统效应角度来确定权重, 比较客观、实际。
(二)案例
区域农业技术创新能力评价:
基于因子分析的实证研究
姚延婷1 陈万明2
( 1. 南京航空航天大学经济与管理学院,江苏南京210016; 2. 西北政法大学经济与管理学院,陕西西安710063)
江苏农业科学 2012 年第40 卷第8 期