文档介绍:第六章参数假设检验
假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念
一、假设检验问题及基本原理
(一)假设检验问题
我们先来看个具体的例子。
某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差s2=,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量=(克),问该日自动包装机包装的平均重量是否还是500克?
某日随机抽取的6袋葡萄糖的平均重量=(克),,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量m=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量m≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。按照逻辑推理,可先假设第一种可能成立,即假设H0:m=m0=500(克)成立。
在假设检验中,通常将所要进行检验的假设称为原假设(或零假设),用H0表示;而将原假设的对立面称为备择假设(或对立假设),用H1表示。
,有原假设H0:m=500;备择假设H1:m≠500。
(二)假设检验的基本原理
假设检验的基本思想就是所谓概率性质的反证法,这即为了检验原假设是否正确,首先假定原假设H0成立,在原假设H0成立的条件下根据抽样理论和样本信息进行推断,如果得到矛盾的结论,就
推翻(拒绝)原假设,否则,则接受原假设。这里我们在概率性质的反证法中运用了小概率原理,即小概率事件在一次试验中几乎不可能发生。如果小概率事件在一次试验中发生了,即认为导出(不合理或出现)矛盾,则可判(推)断原假设不成立。
,应检验原假设H0:m=500(=m0)是否成立。为此,首先假定原假设H0成立,则总体X服从N(m0,),再用样本去检验H0的真伪。由于样本所包含的信息较分散,一般需要构造一个检验统计量去进行判断。,在方差s2已知和原假设H0成立下,考虑m的无偏估计量的抽样分布,有
~,
故可以取
~ N (0,1) ()
作为检验统计量。
对于给定的一个小概率a(0<a<1),通常取a=,可查正态分布双侧分位数表(附表3)得到临界值za/2,(还是用更好?)使得
(对应地,有)(参见图6-1)
此时,事件
=P
是个概率为a的小概率事件。对于一次抽样的样本值,计算统计量z的观测值,如果落在上述小概率事件的范围内,则表明小概率事件在一次抽样试验中居然发生了,即可认为导出矛盾?而拒绝原假设H0。
,由题中条件得
=,m0=500,s2=,
则检验统计量Z的观测值为
再由正态分布分位数表(附表4)查得临界值
za/2==,
由于|z|=<,即小概率事件在一次抽样试验中没有发生,故没有导出矛盾,所以不能拒绝原假设,接受原假设
H0:m=500,
即认为该日自动包装机包装的平均重量还是500克。
在假设检验中,我们将事先给定的小概率a称为显著性水平(Significance level);将拒绝H0还是接受H0的界限值称为临界值(Critical value);将拒绝原假设H0的区域称为拒绝域(Region of rejection)。
,检验的显著性水平a=, 临界值Za/2=,拒绝域为(|Z|≥)。
如图6-1所示,如果由样本值所得到的检验统计量的值落在拒