文档介绍:第五章假设检验
前面第三章的内容属于描述统计学(descriptive statistics)的内容,利用平均数和方差等统计数帮助我们对资料进行分析总结。从本章到第11章的内容属于推断统计学(inferential statistics),研究的范围是统计推断(statistical inference)的方法和理论。统计推断指的是根据样本和假定模型对总体做出的概率形式结论的过程。推断统计学主要包括假设检验(hypothesis testing, test of hypothesis)和参数估计(parametric estimation)两部分内容。比如,由一个样本平均数可以对总体平均数做出估计,但样本平均数包含有抽样误差,用包含有抽样误差的样本平均数来推断总体,其结论并不是绝对正确的,因而要对样本平均数进行假设检验。
假设检验又叫显著性检验(test of significance),是统计学中一个很重要的内容。显著性检验的方法很多,常用的有t检验、F检验和c2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以单样本平均数(总体标准差已知)的假设检验为例来阐明假设检验的原理和步骤,然后介绍单样本平均数(总体标准差未知)的假设检验和两个样本的假设检验,最后介绍区间估计(interval estimation)的基本知识。
第一节统计推断的基本知识
一、概述
在统计学上,假设(hypothesis)指关于总体的某些未知或不完全知道性质的待证明的声明(assertion)。假设可分为两类,即研究假设(research hypothesis)和统计假设(statistical hypothesis)。研究假设是研究人员根据以前的研究结果、科学文献或者经验而提出的假设,比如,人们根据许多研究报告,提出生长期肥育猪(体重20~50kg)的需要量为粗蛋白占日粮的比例15%。统计假设往往是根据研究假设提出的,描述了根据研究假设进行试验结果的两种统计选择。
有统计假设两种,分别为原假设(null hypothesis, H0;或称零假设,虚假设,解消假设)和备择假设(alternative hypothesis, HA;或称对立假设)。原假设通常为不变情况的假设。比如,H0声明两个群体某些性状间没有差异,即两个群体的平均数和方差相同。备择假设,HA,则通常声明一种改变的状态,如两个群体间存在差异。研究假设可以为两种可能之一,即没有差异和有差异。通常情况下,备择假设和研究假设相同,因此,原假设与研究者的期望相反。一般地,证明一个假设是错误的较正确的容易,因此,研究者通常试图拒绝原假设。
假设检验的定义为,假定原假设正确,检验某个样本是否来自某个总体,它可以使研究者把根据样本得出的结果推广到总体。根据样本进行的假设检验有两种结果:(1)拒绝H0,因为发现其是错误的;(2)不能拒绝H0,因为没有足够的证据使我们拒绝它。原假设和备择假设总是互斥,而且包括了所有的可能,因此,拒绝H0则HA正确。另一方面,证明原假设H0是正确的比较困难。
我们根据概率理论和理论分布的特性进行假设检验。概率理论用来拒绝或接受某个假设。因为结果是从样本而不是整个总体得出的,因此,结果不是100%正确。
下面通过一个典型例子,来说明假设检验的基本知识。
【】一个刚工作的大学生在某饲料厂工作,负责购买原料。购买复合维生素时,销售商声称每袋装10 kg。结果可能有4种可能,(1)他很诚实,即m = 10 kg;(2)他很保守,即m > 10 kg;(3)他是个骗子,即m < 10 kg;(4)他也是个新手,不知道每袋到底有多少,即m ¹ 10 kg。为了进行检验,该大学生测量了25袋内容物的重量, kg,假设已知方差为1 kg2。
案例1:检验销售商是否是保守的。
本题有两个假设,第一个是销售商的声明,以及根据他的声明对结果的预测,称作原假设,具体到本例,H0为m = 10 kg。另一个假设为备择假设,它实际上是你的看法,本例的备择假设HA为: m > 10 kg。
因此,本例的假设可以写为:
H0: m £ 10 kg,HA: m > 10 kg
这两个假设互斥,而且包括了所有可能性。因此,H0和HA只能有一个正确,而不可能都正确。
如果原假设H0正确,则我们期望25袋内容物的重量小于或等于10kg。如果备择假设(HA)正确,则每袋内容物应该“显著(significant)”地高于10 kg;这里的“显著”是一个统计学概念,指的是这时H0发生是一个小概率(rare)事件。统计上用来确定或否定原假设为小概率事件的概率标准叫显著性水平(significance level)或检验水平(siz