文档介绍:第七章方差分析方差分析的意义在第五章里介绍了一个或两个样本平均数的假设测验方法,即t测验或u测验的方法,但在农业科学试验中,更多见的是研究多个样本(处理)之间的差异。当对多个平均数作差异显著性测验时,如果采用t测验或u测验的方法分别作出测验存在着以下三个缺陷。首先,对于一个多样本资料采用两两平均数间分别作差异显著性测验非常麻烦,会使统计工作量加大。因为对k个样本平均数进行两两平均数间分别作差异显著性测验,所有可能的平均数差值为k(k-1)∕2个,当k较大时,统计工作量将骤然加大,甚至无法承受。其次,从统计上夸大了样本间的差异,增加了犯第一类错误(否定正确的假设H0)的概率。这是因为,当假设两个样本随机抽自同一正态总体时,其样本平均数的差数()落到抽样分布总体N(,)否定区间的概率(事先规定的显著水平)被扩大了。若对每两个样本测验的显著水平都取,实际上的显著水平已不是,而是>。例如,对于一个均数差值(),两个均数差值时则为1-=;而10个均数差值时犯第一类错误的概率则将达到1-=。再次,对于一个多样本的试验资料,样本间是属于内在关联(尤其是试验误差)的信息整体,这时若对两两平均数间单独进行假设测验,就等于将这一整体割裂开来。从统计的大数定律可知,这将带来误差自由度的损失,并影响对误差估计的精度。因此,对多样本平均数的假设测验,需采用一种更为合适的统计方法―差分析。。方差分析的基本原理是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度;除了可控因素所引起的变异外,用其他剩余变异来准确而无偏的估计试验误差,作为统计假设测验的依据;再通过显著性检验F测验,发现各个因素在变异中所占的重要程度,进而对无效假设(各样本的总体平均数相等)作出统计推断。方差分析在农业试验资料的统计分析中占有十分重要的地位,是最常用的一种统计分析方法。特别是在多因素试验和各种田间设计的试验中,方差分析可以帮助我们发现起主要作用的因素,从而抓住主要矛盾或关键措施。第二节方差分析的步骤一、自由度与平方和的分解在第三章中已介绍过,样本方差也称为均方,即样本标准差的平方,它是一个表示变异的量,是平方和除以自由度的商。因此,要将一个试验资料的总变异分裂成各个变异来源的相应变异,首先必须将总的自由度与平方和分解为各个变异来源的相应部分,即自由度与平方和的分解是方差分析的第一个步骤。现以具有k个处理,每个处理含有n个重复观察值,共有nk个观察值的试验资料为例,来说明自由度与平方和分解的过程。这种类型的资料常来自于盆栽试验等完全随机试验设计,。..1……T1..┇┇┇┇┇┇i……Ti..┇┇┇┇┇┇k……Tk..总和T....,经常用线性模型来表示观察值的变异来源构成,=μ+τi+εij ()式中:µ为在假设全部数据都随机抽自同一正态分布总体时的总体平均数;τi为第i处理对xij的效应;εij为xij的随机误差,以上各参数的样本估计值分别为..=(.-..)=(-.)因此,上述线性模型由样本估计时的表达式为=..+(.-..)+(-.)()如将上述表达式()中的..项移至等式左边,可得到离均差形式(-..)=(.-..)+(-.)()()式表明任一观察值与总平均数..之差都可分解为处理效应和误差效应两部分。如果我们用离均差平方总和(即平方和)这一表示数据变异程度大小的统计量来表示这些变异,则得到关系式(-..)2=(.-..)2+(-.)2()式中(-..)2为总变异平方和,用表示;n(.-..)2为处理平方和,用表示;(-.)2为误差平方和,用表示。即()在实际应用计算中各公式分别为()其中称为矫正数,记为,即 () () (),即总变异自由度=处理间自由度+误差自由度。总变异自由度用表示;处理间自由度用表示;误差自由度用表示。由于计算总平方和时,资料中的各数据要受到(-)=0条件的约束,所以,总自由度为()由于用计算处理间平方和时,要受到(-)=0条件的约束,所以,处理间自由度为()由于计算处理内(误差)平方和时,要受到.)=0(i=1,2,…,k)k个条件的约束,所以,误差自由度为(-1)实际应用公式可用 (-2),即得各变异来源的