文档介绍:1 统计功效与效应大小华中师范大学心理学院刘华山一、统计功效( 检验功效,效力, Power ) 统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。用1-β表示。或说:当总体实际上存在差异,应该拒绝虚无假设时,正确地拒绝虚无假设的概率,或不犯β错误的概率。它表示某个检验探查出实际存在的差异,正确拒绝虚无假设的能力。在实验设计中,统计功效反映了假设检验能够正确侦查到真实的处理效应的能力。统计功效的大小取决于四个条件: 。当两总体实有差异越大,或处理效应越大,则假设检验的统计功效越大; 。显著性标准α越大,则β错误越小,从而统计功效 1-β越大; 反之, α变小, 1-β变小 :当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。 。样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大。二、效应量( 效应大小, Effect Size,ES ) 效应量,反映处理效应大小的度量。其实,两样本平均数的差异就是一个效应量。效应量表示两个总体分布的重叠程度。 ES 越大,表示两总体重叠的程度越小,效应越明显。由计算出的 ES 大小,可由专门的表格中查出两样本分布的 2 重叠的百分比。故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小。或以两个样本不重叠的程度为指标,不重叠的部分百分比越大, 效应量越大。三、效应量检验的功能 ,也就是要检验自变量作用的大小。它不同于差异显著性的检验。统计显著性与实际显著性的区别:差异的统计显著性、相关的统计显著性只是告诉你在特定的条件下,这差异、这相关系数是存在的、并不是完全由抽样误差造成的,但并不意味着这差异有实际意义。大样本比较容易获得统计显著性的结果,但这并不意味着差异是有意义的。 ,主要是有相关意义的效应量,如相关系数,点二列相关系数的平方,,可以反映自变量解释因变量变异的百分比。 3. 在同一个实验中, 如果有几个自变量, 可以根据效应量大小把自变量的重要性排序。 ,将各个不同的相关研究进行概括分析的基础便是各个不同研究的效应量(的合成)。 、提高检验能力提供了根据。 APA 出版手册第五版要求报告差异检验结果时一般要报告 ES 值。美国心理学会 1994 年发出通知,要求公开发表的研究报告包含效应量的测定结果。当具有统计上的显著性后,一定要计算效应量,看你进行的研究是否有价值。四、效应量和统计功效前述检验功效与两总体差异(或说处理效应大小)、样本容量、显著性水平、检验的方向性四个因素有关。可见,统计功效和效应量有关。统计功效受效应量的制约。在检验方向、样本容量、显著性水平固定的条件下,效应量与检验功效有对应关系。见下表。【独立样本】 水平下假设检验的功效样本容量效应大小 3 单尾 10 100 双尾 100 五、独立样本 t 检验的效应大小是一限制。因为平均数对样本数据——,其中) 即合成方差( 以两样本自由度之和, 本离差平方和之和即两样算术平方根,合成方差是两个样本合成方差的,而—.1,1 除 ds Cohen' .1 221121 21 2 2 21ndfndfdfdf ss ssS SS XX p pooled pP???????上述效应量公式等价于 2 ' 21 21 21?????nn ss ss XXds Cohen 例:在大学一年级新生中选取 10名双性化学生和 20名非双性化学生,对他们施测自尊量表。 10名双性化学生得分的平均数为,25 1=X 离差平方和 SS 1 =670 ; 20名非双性化学生得分的平均数为, 18 2=X 离差平方和 SS 2 =1010 。问两组平均数有无差异?(设α= ) 已知,25 1=X SS 1 =670 ;, 18 2=X SS 2 =1010 ,则 4 60 19 9 1010 670 ,240 .116 .53 44 .74 16 .53 120 1010 44 74 110 670 21 21 2 2 1 2 2 221 1 21=+ +=df+df SS + S