文档介绍:: .
第一讲:多元统计方法及应用;多元统计方法分类(按变量、模型、因变量等)
多元统计分析应用
选择
果对Xi作了标准化处理,有
2 2
()
1 hi i
F 2
3、公因子 j的方差贡献gj的统计意义
设因子载荷矩阵为 A,称第j列元素的平方和,即
2 2
gj 可 J 1,2,L ,m
i 1
为公共因子
F
J对X的贡献,
2
即gj表示同一公共因子
F
Fj对各变量所提供的方差贡献
之总和,它是衡量每一个公共因子相对重要性的一个尺度。
因子分析模型及假设
数学模型:每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即:
Xi=ai1*F1+a12*F2+ …+aim*Fm+£ i (i=1,2,…,p)式中的 F1,F2,…Fm称为公共因子,
t i称为Xi的特殊因子。该模型可用矩阵表示为: X=AF+ |,
且满足:(1) m菸p(2)Cov(F, )=0,即公共因子与特殊因子是不相关的; (3)
1,0,0…0
0,1,0…0
DF=D(F)= 0,°,°…1 =Im,即各个公共因子不相关且方差为1 ; ( 4 )
2
1,0,0...0
2
0, 2,0...0
2
0,0,0...
D =D( )= p,即各个特殊因子不相关,方差不要求相等。
因子旋转 因子旋转的目的:初始因子的综合性太强,难以找出因子的实际意义,因此需要通
过坐标旋转,使因子负荷两极分化, 要么接近于0,要么接近于于1,从而降低因
子的综合性,使其实际意义凸现出来,以便于解释因子。
3种,常用最大方
因子旋转的基本方法:一类是正交旋转(保持因子间的正交性, 差旋转),一类是斜交旋转(因子间不一定正交)
公共因子提取个数:(1)选特征值大于等于 1的因子(主成分)作为初始因子,通
过求响应的标准化正交特征向量来计算因子载荷 (2)碎石图: 删去特征值变平缓的
那些因子( 3)累计方差贡献率大于 85%
第五讲:聚类类型,系统聚类、 K- 均值聚类思想及步骤,系统聚类方法,相似性测度方法
聚类类型:根据分类的对象可将聚类分析分为:系统 Q型与R型(即样品聚类与变
量聚类)
系统聚类、K-均值聚类思想及步骤:①系统聚类的基本思想:距离相近的样本(或 变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量) 总能聚到合适的类中。
② 聚类过程及步骤:假设总共有 n个样品(或变量),第一步将每个样品(或变量)
独自聚成一类,共有 n 类;第二步根据所确定的样品(或变量) “距离”公式,把距 离较近的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类, 共聚成n-1类;第三步将“距离”最近的两个类进一步聚成一类, 共聚成n-2类;…,
以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。最后可以画谱 系图分析。
③ 快速聚类的基本思想,步骤: (也称为K-均值法,逐步聚类,迭代聚类),基本思
想是将每一个样品分配给最近中心(均值)的类中,具体的算法步骤如下: