文档介绍:
一、列联表及其作用
(定类尺度或定序尺度)分类时所列出的频数表。
(或多个)分类变量的统计学关联。如行变量与列变量之间的关联性。
多元统计分析——对应分析
2021/1/13
1
一般,若总体中的个体可按两个属性A与B分类,A有n类A1,A2,…,An,B有p类B1,B2,…,Bp, 属于Ai和Bj的个体数目为nij(i=1,2, …,n;j= 1,2, …,p),nij称为频数,则可形成n×p的二维列联表,简称n×p表。
若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。
多元统计分析——对应分析
2021/1/13
2
列联表
B1
B2
Bj
Bp
A1
n11
n12
…
n1j
…
n1p
n1.
A2
n21
n22
n2j
n2p
n2.
Ai
ni1
ni2
nij
nip
ni.
An
nn1
nn2
nnj
nnp
nn.
n
多元统计分析——对应分析
2021/1/13
3
频率意义上的列联表
B1
B2
Bj
Bp
A1
p11
p12
…
p1j
…
p1p
p1.
A2
p21
p22
p2j
p2p
p2.
Ai
pi1
pi2
pij
pip
pi.
An
pn1
pn2
pnj
pnp
pn.
1
多元统计分析——对应分析
2021/1/13
4
列联表独立性检验
对于数值型变量相关关系,通常是计算相关系数和进行回归分析。
描述两个定性变量之间的相关性是指广义的相关性,称为关联性。两个定性变量的关联程度在某种意义上就是指的“不独立”,它与独立的情形差距越大,就表明彼此的关系越密切,这种关系不一定是线性关系。在实际问题中,重要的是判断变量之间是否独立,因为不独立就意味着关联。最常用的检验办法是列联表独立性检验。
列联表检验的零假设是两变量 X和Y 相互独立,计算一个卡方统计量,与列联表中频数取值和零假设下期望取值之差有关,当卡方 很大时否定零假设。
多元统计分析——对应分析
2021/1/13
5
例 吸烟与慢性支气管炎调查表
为了探讨吸烟与慢性支气管炎有无关系,调查了339人,情况如表所示:
设想有两个随机变量A,B:A:1表示吸烟,
2表示不吸烟;
B:1表示患慢性支气管炎,
2表示未患。
零假设为:
H0: A与B相互独立
B
A
患慢性支气管炎
未患慢性支气管炎
吸烟
43
162
不吸烟
13
121
多元统计分析——对应分析
2021/1/13
6
STATISTICS FOR TABLE OF SMOKE BY BRON Statistic DF Value Prob Chi-Square 1 Likelihood Ratio 1 Chi-Square Continuity Adj. Chi-Square 1 Mantel-Haenszel Chi-Square 1 Fisher's Exact Test (Left) -03 (Right) (2-Tail) -03 Phi Coefficient - Conti