文档介绍:第 5 章参数估计
参数估计的一般问题
一个总体参数的区间估计
两个总体参数的区间估计
样本容量的确定
统计推断的过程
样本
总体
样本统计量
如:样本均值、比率、方差
总体均值、比率、方差等
参数估计的一般问题
一、估计量与估计值
二、点估计与区间估计
三、评价估计量的标准
估计量:用于估计总体参数的随机变量
如样本均值,样本比率、样本方差等
例如: 样本均值就是总体均值的一个估计量
参数用表示,估计量用表示
估计值:估计参数时计算出来的统计量的具体值
如果样本均值x =80,则80就是的估计值
估计量与估计值
点估计
用样本的估计量直接作为总体参数的估计值
例如:用样本均值直接作为总体均值的估计
例如:用两个样本均值之差直接作为总体均值之差的估计
没有给出估计值接近总体参数程度的信息
点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等
点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围区间估计。
区间估计
含义:在点估计的基础上,估计总体参数的区间范围,并给出区间估计成立的概率值。
其中: 1-α(0<α<1)称为置信水平
α是区间估计的显著性水平;
常用的置信水平值有 99%, 95%, 90%
相应的,,
注意对上式的理解:
例如抽取了1000个样本,根据每一个样本均构造了一个置信区间,,这样,由1000个样本构造的总体参数的1000个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。
一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。
样本统计量(点估计)
置信区间
置信下限
置信上限
由样本统计量所构造的总体参数的估计区间称为置信区间
统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值
我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个
置信区间
我们用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,如何理解?
错误的理解:60-80区间以95%的概率包含全班同学平均成绩的真值;或以95%的概率保证全班同学平均成绩的真值落在60-80分之间。
正确的理解:如果做了多次抽样(如100次),大概有95次找到的区间包含真值,有5次找到的区间不包括真值。
真值只有一个,一个特定的区间“总是包含”或“绝对不包含”该真值。但是,用概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。
如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:
该班同学平均成绩的置信区间是60-80分,置信度为95%。
置信区间与置信水平
样本均值的抽样分布
(1 - ) % 区间包含了
% 的区间未包含
1 – a
a /2
a /2
区间估计的图示
x
95% 的样本
-x
+x
99% 的样本
- x
+x
90%的样本
- x
+x