文档介绍:统计学
─从数据到结论
第六章总体参数的假设检验
如果一个人说他从来没有骂过人。他能够证明吗?
要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。
即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到骂人。
反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够了。
看来,企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。
科学总往往是在否定中发展
在假设检验中,一般要设立一个原假设(上面的“从来没骂过人”就是一个例子);
而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。
在多数统计教科书中(除理论探讨外)假设检验都是以否定原假设为目标。
如否定不了,说明证据不足,无法否定原假设。但不能说明原假设正确。
就像一两次没有听过他骂人还远不能证明他从来没有骂过人。
§ 假设检验的过程和逻辑
先要提出个原假设,比如某正态总体的均值等于5(m=5)。这种原假设也称为零假设(null hypothesis),记为H0。
与此同时必须提出备选假设(或称为备择假设,alternative hypothesis),比如总体均值大于5(m>5)。备选假设记为H1或Ha。形式上,这个关于总体均值的H0相对于H1的检验记为
§ 假设检验的过程和逻辑
备选假设应该按照实际世界所代表的方向来确定,即它通常是被认为可能比零假设更符合数据所代表的现实。
比如上面的H1为m>5;这意味着,至少样本均值应该大于5;
至于是否显著,依检验结果而定。
检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significant test)。
§ 假设检验的过程和逻辑
有了两个假设,就要根据数据来对它们进行判断。
数据的代表是作为其函数的统计量;它在检验中被称为检验统计量(test statistic)。
根据零假设(不是备选假设!),可得到该检验统计量的分布;再看这个统计量的数据实现值(realization)属不属于小概率事件。
§ 假设检验的过程和逻辑
也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴;
如果的确是小概率事件,那么就有可能拒绝零假设,或者说“该检验显著,”
否则说“没有足够证据拒绝零假设”,或者“该检验不显著。”