文档介绍:统计功效与效应量
华中师范大学心理学院 刘华山
一、统计功效(检验功效,效力,Power)
统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。用1-0表 示。
或说:当总体实际上存在差异(备择假设 H 为真),应该拒绝虚无假设
50
100
双尾
10
20
30
40
50
100
【此表反映了决定统计功效的几个因素:检验方向、样本规模、显著性水平、 差异大小(效应量)。】表中上栏中的 3 个数字为效应量,下栏对应的 3 列各数字 为统计功效。从中可看出,在相同情况下(相同的检验方向、相同的样本容量, 显著性水平),效应量越大,统计功效越高。其他项相同的条件下,样本容量越 大,检验功效越高;其他项相同的条件下,单尾检验比双尾检验统计功效高。实 际上当效应量较小时,而计算出的1-0越大,说明统计功效很高,即较小的效 应量是对统计功效的严格检验。
五、独立样本 t 检验的效应大小
1. ES = X1 一 X2,而s是两个样本合成方差的算术平方根,合成方差即两样
S p
P
本离差平方和之和除以两样本自由度之和,即
S2 = 1 2,其中df = n 一 1,df = n 一 。
p df + df 1 1 2 2
注意:S不是两平均数之差的样本分布的标准误SE—而是标准误公式中
p X1-X 2
的一部分。即公式
SE =
DX
,(n ——1) s 2 + (n ——1) s 2 1 1
1 12 2 ( + )
n n
1 2
1 2
n + n 一 2
1 2
中的(n1T)s12 + gT)汽部分的平方根。
df = "1+ "2 一 2
1 2 -
n +n 一2
12
l(n 一 1) s 2 + (n 一 1) s 2 即,—1 12 2
n + n ——2
丫 1 2
上述效应量公式等价于
SE =
'SS + SS
n + n - 2
I 1 2
此公式的含义是以两样本平均数的差异用两样本的联合方差的平方根(联合
"1 + “2 < 1(当 n ,n > 2时丿,其
n n 1 2
12
标准差)去度量所得的量数,作为效应量的指标 【也应是 Cohen's d 的一种?】
11
从本公式中可看出:t检验公式中的(一 + )=
n
2
11
t 越大,差异越显著。现在求 S p
作用是:当样本容量越大时,(一 + )越小,
nn
12
11
公式中去掉了 ( — + )因子,等于是惩罚了大样本,消除了在效应量小的条件下,
nn
12
仅仅由于样本容量大而造成差异显著性高的情况。
例:在大学一年级新生中选取 10 名双性化学生和 20 名非双性化学生,对他
们施测自尊量表。10名双性化学生得分的平均数为 X1 = 25,离差平方和SS =670;
20名非双性化学生得分的平均数为X2
=18,离差平方和 S S = 1 0 1 0。问两组平均数
2
有无差异?(设a =)
已知 X i = 25, SSi=670;
X 2=18,
SS=1010,则
2
S2 =Sf1 =岳=74M S2
1
SS 1010
2 = =
df 20 — 1
2
.= < 2,
进仃万差齐性检验,得=
S2
2
根据拇指原则,可以认为万差齐性,可以求合成万差
SS +SS 670+1010
S 2 = 1 2 = = 60
p df +df 9 +19
12
平均数差异的样本分布的标准误为
[ [ 1 1
SE = 'S2」+ 丄)=-60 x G- + --) = 3 dx p n n 10 20
1 2
+ X -X 25—18
SE 3
所以无显著差异。
233 <t 0愛28)= 2763
求效应量
X —X 25-18
ES 二 i 2
S
p
,查表可知两样本分布重叠部分只有4&4 % x 60
这说明由双性化与非双性化造成的差异还是较大的。
's d
⑴指标 1
d = X1- X2
X]、X 2 -样本1,2的平均