文档介绍:在双样本情况下,假设我们从一个总体中成对抽取两个样本,分别计算样本平均数,计算二者之差,得到差值的分布,就是平均数差值(△)的抽样分布。
平均数差值△的抽样分布
假设一个总体是μ=,σ= ,采取有放回抽样。每次抽取两个样本,样本量分别为2和3.
μ=
σ=
X1=5X2=6
X1=4X2=4X3=7
…….假如这样继续下去,把这些差值看做一组原始分数,则可以构建频次分布,这个分布是什么样的呢?
=
进一步描述两样本均数差值的分布,即便不是从同一总体抽取的两个样本,其结论是:
样本均数差值的总体平均数=
样本均数差值的标准差=
称为平均数差异的标准误=
样本平均数差异的分布服从正态分布
统计量
服从标准正态分布
利用这个标准正态的 z 统计量,可做假设检验
通过样本数据估计标准误
只有总体标准差σ已知时,才能使用 z 检验。但是总体标准差σ一般是未知的,根据中心极限定理和大样本下(N≥30或100),z 和t 值之间差异较小,可以采用 t 检验。
估计标准误:
如果样本量不等,估计的标准误属于有偏估计。
如果两总体σ2未知但已知
11-1
但是,如果n1=n2,那么公式简化为:
其中
统计假设检验: t 检验
H0:μ1-μ2=0 H1: μ1-μ2≠0
df=n1+n2-2
t 检验的应用举例
某学者研究先验情绪对后续情绪的影响,将20名男性被试平分为实验组和控制组两组,实验组先看6个幽默电视画面,再看5个恐怖画面,控制组仅看恐怖画面。测验分数越高,则不愉快程度越高,测验分数见表11-1.
实验组X
36
31
36
20
41
34
32
34
32
33
和
329
X2
1296
961
1296
400
1681
1156
1024
1156
1024
1089
和
11083
控制组X
29
34
27
33
10
28
26
31
30
35
和
283
X2
841
1156
729
1089
100
784
676
961
900
1225
和
8461
实验组平均数=,控制组平均数=
1. H0:μ1-μ2=0
2. H1:μ1-μ2 ≠0
3. 统计检验:因为σ未知,所以使用 t 检验
4. 显著性水平:α= , 双尾
5. 抽样分布:自由度df=n1+n2-2=18的 t 分布
6. 拒绝H0的临界区间:| t |≥
=11803-3292/10=
=8461 -2832/10=
==
df=18
因为|t |< ,。差别无统计意义,我们不能肯定先幽默后恐怖对情绪的影响。
如果样本增大,也许这两组的差异会达到显著性。
图11-3 对一大一小两个样本平均数差异的分布,进行两样本平均数的比较时,样本大小会影响其差异的显著性
t 比率与方差齐性
使用 t 分布的基本假设
1. 平均数差异的抽样分布是正态分布
2. 对即的估计是基于对总体方差的无偏估计
3. 方差齐性(homogeneity of variance )
图11-4 等方差
不等方差