文档介绍:一、概念
将原来众多具有一定相关性的指标,重新组合成一组新的相互独立的综合指标(主成分)。
二、意义
在保存主要(zhǔyào)信息的前提下,简化结构和解决共线问题。
多维→二维,利用找到的综合变量来对观察对象排序。
§1 Principal component analysis P280
第1页/共32页
第一页,共33页。
三、方法
n个对象,m个指标:P281表2。
原始数据标准化→ m个标准化指标的r→ 相关矩阵R→特征根λ→特征向量a→主成分 F
λ :主成分的方差,该主成分可解释平均(píngjūn)多少原始变量的信息,占总方差的比重为该F的贡献率。前P个F的贡献率之和为累计贡献率。
因子载荷:主成分Fi与变量xj的相关系数=a
第2页/共32页
第二页,共33页。
: 能否作主成分分析与因子分析。
(1)KMO统计量:0~1,各指标间相关程度(chéngdù)。KMO >
<
(2)Bartlett球形检验 :原指标间是否独立,
P>。
(quèdìng)F数目: 根据实际需要,两法结合。
(1)累计贡献率:应>70%or 80% , F偏多。
(2)特征值 :≥1的F应保留。 偏少。
第3页/共32页
第三页,共33页。
【例20-1】某医院测得20名肝病患者(huànzhě)的SGPT(转氨酶)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,作主成分分析。
病例号
转氨酶
肝大
指数
硫酸锌
甲胎
蛋白
病例号
转氨酶
肝大
指数
硫酸锌
甲胎
蛋白
1
40
5
20
11
180
14
40
2
10
5
30
12
130
30
50
3
120
13
50
13
220
17
20
4
250
18
0
14
160
35
60
5
120
9
50
15
220
14
30
6
10
12
50
16
140
20
20
7
40
19
40
17
220
14
10
8
270
13
60
18
20
12
60
9
280
11
60
19
40
10
0
10
170
9
60
20
120
20
0
第4页/共32页
第四页,共33页。
【SPSS操作】转氨酶(标SGPT)、肝大指数(G)、硫酸锌(Z)、甲胎蛋白(AFP)为变量名,建立4列20行(20名患者)的数据(shùjù)文件L20-。
Analyze → Data Reduction(数据(shùjù)简化)→ Factor,全部变量入Variables框→ Descriptives,√ KMO and Bartlett’s test of sphericity→Continue→Extraction,√ Scree plot→Continue→Scores,√ Save as variables、√ Display factor score coefficient matrix→Continue→OK
第5页/共32页
第五页,共33页。
第6页/共32页
第六页,共33页。
KMO统计量=<,4个指标间相关程度差异大,不适于主成分分析和因子分析。化简少,保留F多。
球形检验近似χ2=,P=,4个指标不独立(dúlì),可进行主成分分析。保留F少。
第7页/共32页
第七页,共33页。
第8页/共32页
第八页,共33页。
Initial Eigenvalues(初始(chū shǐ)特征值)、Extraction Sums of Squared Loadings(提取负荷平方和):前2个因子的特征值大于1,Cumulative %(累积)%
第9页/共32页
第九页,共33页。
特征值的贡献还可从SPSS的碎石(suì shí)图看出
第10页/共32页
第十页,共33页。