1 / 31
文档名称:

第8章 主成分与因子分析1.ppt

格式:ppt   大小:725KB   页数:31页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第8章 主成分与因子分析1.ppt

上传人:yuzonghong1 2017/11/18 文件大小:725 KB

下载得到文件列表

第8章 主成分与因子分析1.ppt

相关文档

文档介绍

文档介绍:第8章主成分与因子分析
主成分分析与因子分析的目的在于降维,即在众多存在的相关性的变量中,找出少数几个综合性变量,来反映原来变量所反映的主要信息,使问题简化。
主要作用
能降低所研究的数据空间的维数;
可用于分析筛选回归变量,构造回归模型;
可用于综合评价;
可对变量进行分类
主要内容
主成分分析
因子分析
主成分分析和因子分析的区别
用SPSS进行因子分析
§ 主成分分析
主成分分析的数学模型
(ponents)含义:
例:上衣尺寸主要包括领长、袖长、衣长、

领围、肩宽、臂围、胸围、腰围、臀围、袖宽等 14

个变量,显然它们是相关的,因此可以找出反映上衣特征的两个不相关的综合变量,就是上衣的号和型。
如:(男)180/100A 、 175/96A;(女)165/84A等
F1
* *
* *
* *
* *
:
儿童身高(X1)和体重(X2)两个变量之间的关系可以用散点图表示出来,。
显然,这两个变量之间存在线性关系。现在以直线P1为横坐标,以该轴的垂直线P2为纵坐标,建立一个新的平面直角坐标系,则所有观测点均在坐标轴P1周围(即沿该方向观测值方差最大),而在坐标轴P2方向上的波动很小,可以忽略。
这样,二维问题即可以降为一维问题,只取一个综合变量P1(主成分)即可。
X2
F2
*
* *
θ
X1
指标1(X1)
指标2(X2)
指标p(Xp)


第1次观测值
第n次观测值
为找出主成分,寻求原变量X1,X2,…,Xp的线性组合Fi,其数学模型
模型可简写为
P=u1X1+u2X2+…+upXp =UTX
若令式中U=(u1,u2,…,up)T,
X=(X1,X2,…,XP)T
满足如下的条件:
(1) Pi和Pj不相关,即
(2) 主成分的方差依次递减,重要性依次递减,即
称Pi为第i主成分(i=1,2,…,p)。
(3) 总方差不变,即
(4) 每个主成分的系数平方和为1,即
(见板书)

为简化问题,通常提取q(q<p)个主成分,原则是这q个主成分能够反映出原来P个变量的绝大部分的方差。
几个概念:
1) 主成分的方差贡献率
第i个主成分的方差在全部方差中所占的比重:
称为第i个主成分的方差贡献率,反映了第i个主成分综合原来P个变量信息的能力。
2) 主成分的累积方差贡献率
前q个主成分共有多大的信息综合能力,用这q个主成分的方差和在全部方差中所占比重来描述,称为前q个主成分的~


主成分分析的步骤及应用

第一步:确定分析变量,收集数据资料。
第二步:对原始数据进行标准化。
第三步:对标准化后的样本数据资料计算协差阵或相关阵。
第四步:计算∑或R的特征值及相应的特征向量Ui,并按λi
的大小排序(i=1,2,…,p)。
第五步:计算主成分的贡献率及累计贡献率。
第六步:确定主成分个数。
≥80%的前q个主成分
≥1的前q个主成分。
第七步:将样本数据代入前q个主成分的表达式,可分别计
算出各单位前q个主成分的得分。