文档介绍:样本均数的抽样误差与置信区间
样本均数的分布
·从同一总体中独立抽取多份样本, 他们的均数常大小不一, 这说明样本均数存在变异。通过电脑实验来认识样本均数的变异规律
一、正态总体样本均数的分布
从正态分布总体抽样的实验假定正常男子的红血球计数服从正态分布N(, ),随机抽取1000份样本, 每份含n=5个个体。样本均数依然是一个随机变量, 且
(1)
(2)
(3) 样本均数的分布很有规律,围绕着总体均数,中间多、两边少, 左右基本对称(对称、正态?);
(4)
(5) 随着样本量的增大,
(a) (b) (c) 从正态分布总体抽样的实验结果 2 从N(, )中随机抽样, 样本量为5, 100份独立 12
* 由这份样本估计的95%置信区间实际上并未复盖总体均数
从N(, )中随机抽取1000
份独立样本, 其均数的频数分布
12组段下限(10 /L) 频数频率(%) 累积频率(%)
- 1
- 5
- 32
- 117
- 229
- 304
- 218
- 76
- 15
- 3
合计 1000
·理论上可以证明, 从正态分布N(μ, σ2)的总体中随机抽取含量为n的样本,其样本均数~N(μ, σ2 /n)。
·样本均数的标准差习惯上又称为样本均数的标准误(standard error),简称标准误。值得注意的是如下的普遍规律:
或·实际应用中往往总体标准差σ未知, 人们只能用样本标准差S代替σ,从而获得σ的估计值S,则有
·为方便计,可称σ为理论标准误,S为样本标准误。
二、非正态总体样本均数的分布
从正偏峰的分布总体抽样的实验
(1) 随着样本量的增大, 样本均数分布的对称性逐渐改善, 样本
量为30时, 样本均数的分布接近正态分布;
(2) 随着样本量的增大, 样本均数的变异范围逐渐变窄。
1 2 3 4 5 6 7 8 9 n=5
1 2 3 4 (b) 5 7 8 1 2 3 4 5 6 7 8
9 (d) (e)
从正偏峰的分布总体分布抽样实验的结果(a)是原分布,正偏峰;其它为不同样本含量时样本均数的直方图
(a):
(1) 样本均数分布再不象个钩子, 样本量很小时就象正态分布了;
(2) 随着样本量的增大, 样本均数的变异范围也逐渐变窄。·以上两项实验的结果具有普遍性。理论上可以证明, 非正态总体样本均数的分布并不是正态分布;但当样本量较大时(例如,n≥30), 样本均数的分布接近正态