文档介绍:第 4 章抽样估计与假设检验
参数估计在统计方法中的地位
参数估计
假设检验
统计方法
描述统计
推断统计
抽样调查与假设检验概述
抽样推断是依据随机原则,从总体中抽取一部分单位组成样本进行调查,并依据样本资料计算的特征值,对总体特征之作出具有一定可靠程度的估计,以达到认识总体树立郎特征的目的。
主要内容:
统计估计
假设检验
估计量与估计值(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量
如样本均值,样本比率、样本方差等
例如: 样本均值就是总体均值m 的一个估计量
2. 参数用q 表示,估计量用表示
3. 估计值:估计参数时计算出来的统计量的具体值
如果样本均值`x =80,则80就是m的估计值
参数估计的方法
点估计(point estimate)
1. 用样本的估计量直接作为总体参数的估计值
例如:用样本均值直接作为总体均值的估计
例如:用两个样本均值之差直接作为总体均值之差的估计
2. 没有给出估计值接近总体参数程度的信息
3. 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等
区间估计(interval estimate)
在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
置信下限
置信上限
区间估计的图示
m
x
95% 的样本
m -
m +
99% 的样本
m -
m +
90%的样本
m - sx
m +
置信水平
1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平
2. 表示为(1 - a% )
a 为是总体参数未在区间内的比率
3. 常用的置信水平值有 99%, 95%, 90%
相应的 a ,,
置信区间(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称为置信区间
2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值
我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个
置信区间与置信水平
样本均值的抽样分布
(1 - a) % 区间包含了m
a % 的区间未包含m
1 – a
a /2
a /2
影响区间宽度的因素
总体数据的离散程度,用 s 来测度
样本容量,
置信水平(1 - a),影响 z 的大小
无偏性(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
P( )
B
A
无偏
有偏
有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
A
B
的抽样分布