文档介绍:第4章方差分析(ANOVA)实验设计和分析
Catherine Potvin
弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOVA)。本章重点放在实验设计上。虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。我还要讨论错误实验设计的代价。本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。实验者通常进行的实验比这里展开的要复杂。但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
统计问题:环境变化与统计分析
正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。实验设计为处理这类无其它办法可控制的变异性提供了办法。因而,一个好的实验设计会减少实验误差。检验不同的实验设计有助于选择合适的设计。并且将与各种变化来源有关的自由度清楚地分开。因而选择正确的实验设计对防止类似假重复和相互干扰的问
题来说至关重要(Hurlbert 1984)。本章所讨论的内容要求读者对方差分析(ANOVA)有一定的基础知识,从而我可以讨论一些方差分析中不太常见的方面。方差分析统计处理的细节可见Sealer(1971)。
方差分析(ANOVA)使用抽样数据来检验关于总体的假设。基于特定线性模型的方差分析将方差分配到各影响因子(通常是处理)。一个因子可以划分成任意数目的等级(Sealer 1971)。线性模型中描述数据的参数可由一些技术如最小二乘法或最大似然值等方法来估计。传统上用于ANOVA的最小二乘法估计值将观测数据与期望数据离差的平方和最小化(Sealer 1971)。在最小二乘法分析中,如果数据组是平衡的(即每一分析组(cell)观测数相等),则离差平方总和能很容易被分解为实验设计中各因子所分别贡献的平方和(SS)。离差,作为余值则是观测值与均值之差。这种结果是具最小方差的无偏估计值,这是估计值的上佳性质(Winter 等1991)。均方(MS)是每自由度的平均变异,由平方和除以自由度(SS/df)得出。在此意义上,均方和统计方差等价。每一个计算出来的均方都有一个相对应的期望值,。在ANOVA 中假设检验所依赖的统计量F,由两个均方的比值得出。因而,探测兴趣所在因子的影响概率依赖于正确使用误差项。
二方差分析(ANOVA)*的期望均值平方与F-比值
影响期望均方 F-比值
A
Ai MSA/MSe
Bj MSB/MAe
ABij MSAB/MSe
余值(误差)
B
Ai MSA/MSAB
Bj MSB/MSAB
ABij MSAB/MSe
余值(误差)
*A)固定影响分析模型,B)随机影响分析模型
误差项的重要性可由下例说明:ANOVA的基本理论承认两类影响:随机影响与固定影响有本质上的区别。我们可将一个随机因子的水平视为从一个大的确定的集合随机抽取的,而固定因子的水平则是由实验者特意选取的。从生物学上而言,影响是固定的还是随机的在进行推论上是重要的。如果影响被认为是固定的,其研究结果就不能推广到研究水平以外。因为所检验因子的水平是特意选择的。如果要将一个处理因子推广到其它水平,该因子的影响就一定要被认定为是随机的。增加大气中CO2浓度的研究为固定因子影响提供了一个清楚的例子。研究者通常比较当前CO2水平(350ml/l)的影响与预测的21世纪中期的倍增浓度(650ml