文档介绍:第三节样本容量的确定
在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实际意义。如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。可见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题。
一、均值估计问题中,样本大小的决定
在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题:
1. 要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值是多少,实际上也就是估计区间的大小,
2. 规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误差的可信度。
3. 要明确总体的标准差,即要求了解总体的分布情况。总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。
设总体标准差为,样本均值的标准差为。估计的置信度为,于是可以相应地得到置信系数。于是对总体均值的估计可由下式得到:
上式中的实际上就表示估计所允许的最大误差,我们用Δ表示,于是根据上式有
则
由此只要规定了允许误差的大小Δ和总体的标准差σ,由置信度查表得到相应的,代入公式,求得满足要求的最小整数就是满足估计误差不大于Δ和置信度为的要求的最少样本数。
上述公式适用于重复抽样或无限总体不放回抽样时的情形。但对于有限总体不放回抽样的情形,公式变为如下的形式:
由此可求得满足上式要求的最小的整数为
。
其中:Δ为允许最大误差,
为有限总体的个体数,
为置信度水平,
为根据置信度水平查表得到的置信系数。
二、比例估计问题中,样本大小的决定
关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题中同样的三个问题:
1. 允许误差的大小,即规定估计值与实际值的最大偏离值。
2. 规定置信度,即估计所要求达到的可信度。
3. 对总体比例的事先估计值,即大致的或估计的总体比例是多少。
与均值的估计问题完全平行地,我们可以得到以下的结果。
对于重复抽样或无限总体不重复(放回)抽样时的情形为
但对于有限总体不放回抽样的情形,公式变为如下的形式:
第四节假设检验
一、假设检验的基本原理
假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。差异越大,对总体均值的假设正确的可能性就愈小。
然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。于是就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。于是就需要研