文档介绍:第二节区间估计
一、区间估计的概念和步骤
点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。
在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,,,。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:
1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。
2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。
一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的,若P()=,则称区间[]为置信度是的置信区间。分别为置信区间的下限和上限。称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。
常用的置信度有 ,, 。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平,也可理解为风险率或风险水平。
图5-2 %的置信区间
需要指出的是,P()=不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。即每一个样本都可产生一个估计区间
[],因此,上述概率可以理解为随机区间[]中包括参数的概率。
图5-%的置信区间与总体均值的位置关系。%的区间将包括总体均值,%的置信度。
二、单个总体参数的区间估计
(一)正态总体,方差已知,总体均值的区间估计
根据第四章关于样本均值分布的结果,有
~N(0,1)
在给定了估计置信度为时,我们有
我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为,同时若规定置信度为,则总体均值的区间估计的公式是
这一置信区间的估计可以用图5-3来表示。
上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N,样本大小为n,则区间估计的公式中还需要乘上一个修正系数。因此,总体均值的区间估计的公式就变为
图5-3 置信度为的置信区间
从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:
1. 计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,那么样本均值也必然服从正态分布。
2. 根据研究的目的确定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相应的系数。
3. 计算