文档介绍:第五章统计推断
所谓统计推断就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总体特征(参数)。试验实践中所获得的资料,通常都是样本的结果;而我们希望了解的却是抽得样本的总体。
统计推断:统计假设测验
参数估计
统计假设测验是根据某种实际需要对未知的或不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,做出在概率意义上应当接受哪种假设的测验。
例如在相同的栽培管理条件下种植了甲、乙两个玉米品种各15个小区,如果测得甲品种平均亩产为=650 kg,乙品种平均亩产为=670 kg,亩产相差20 kg,这究竟是由于甲品种的总体平均数m1的确不同于乙品种的总体平均数m2呢?还是由于随机抽样误差(m1和m2并无不同)?这不能通过简单的比较来下结论,必须通过概率计算做出选择,这就是统计假设测验要研究的问题。
参数估计是指由样本统计数对总体参数做出点估计和区间估计。点估计是指由样本统计数估计相应参数。区间估计是指以一定的概率保证总体参数位于某两个数值之间。
第一节统计假设测验的基本原理
一、统计假设测验的基本方法就是试验工作者提出有关某一总体参数的假设。例如假设某批产品符合标准。但是如何确切地证实假设是正确的还是错误的呢?当然可以把全部产品逐个检验,这种研究总体中全部个体的方法当然是很准确的,但往往是行不通的。我们不得不采用另一种方法,即研究样本。也就是从全部产品中抽取样本进行检验,然后推断这批产品是否合格。这种利用样本以测验假设是否正确或错误的过程,称为一个假设正确性(或不正确性)的统计证明。如果通过测验证明假设与试验结果相符,则该假设就被接受;反之,如果假设与试验结果不相符,则该假设就被否定。
对统计总体一般作两个假设,一个是假设总体参数与某一指定值相等或假设两个总体参数相等,即假设其没有效应,这一假设称为无效假设,记作H0;和无效假设相对应的另一统计假设,叫对应假设或备择假设,记作HA。H0 和HA应是对立的假设,即,如果接受H0就否定HA,如果否定H0就接受HA。例如:假设某一小麦新品种具有原当地品种的产量,是指就产量性状而言,将新品种样本看成原当地品种总体的一个随机样本,其总体平均产量m等于指定值m 0 (当地品种平均产量),故记作H0:m =m 0,对应假设为HA:m ≠m 0。
测验前提出无效假设的目的在于:可从假设的总体里推论随机抽样平均数的分布,从而算出某一样本平均数指定值出现的概率,这样就可以研究样本与总体的关系,作为假设测验的理论依据。无论是平均数,百分数,还是变异数的统计假设,均应在试验前按研究目的提出。H0的形式和内容可以多种多样,但必须遵循两个原则:①有实际意义;②据之可以算出因抽样误差而获得样本结果的概率。下面通过例子来说明假设测验的基本方法。
[]设一水稻地方品种亩产m 0 = 500 kg, s 2 = 324 kg
现一新品种平均亩产= 515 kg, =9(9个试验小区) 问:这样本是否从m = 500 kg的总体中随机抽出的,即该的总体平均数m是否不同于m 0,亦即-m 0 = 15 kg,这一差数究竟是抽样误差造成的?还是m确实与m 0不同。
1、提出假设
这是测验单个平均数,则假该样本是从已知总体(总体平均数为指定值m 0)中随机抽出的,即H0:m = m 0。如上例,即假设新品种的总体平均数m等于原当地品种总体m 0 = 500 kg,而样本平均数-m 0 = 515 - 500 = 15 kg乃是随机误差;在H0:m = m 0的假设下,我们就有一个具平均数m = m 0 = 500 kg、= = = 36的分布,即N(500,36);据之才能算得因抽样误差而获得一个与m 0的相差≥15 kg的的概率。如测验两个平均数,则假设两个样本的总体平均数相等,即H0:m1 = m 2,也就是假设两个样本平均数的差数1-2乃随机误差,而非真实差数。
备择假设)HA是与H0 对立的假设,则HA:m1 ≠ m 2,即两个样本的总体平均数不相等。
2、确定一个否定H0的概率标准
这个标准叫显著水平,记作a。a是人为规定的小概率标准。在生物学研究中常取a = = (水平)。也可选a = = 。显著水平的选择,应根据试验要求或试验结论的重要性而定。
3、在“无效假设是正确的”假定下,研究样本平均数的抽样分布
算出试验所得平均数出现的概率有多大,即算出实得结果由抽样误差造成的概率。或者划出接受区和否定区。二法选一即可。
(1)计算概率的方法
,在H0:m = m 0的假设下可算得:
u = = =
查附表2,P(∣∣> ) = 2 ×