文档介绍:第八章方差分析和回归分析
在生产过程和科学实验中,经常遇到这样的问题:影响产品的质量、产量的因素很多,我们需要通过观察或试验来判断哪些因素对产品的质量、产量有显著的影响,方差分析就是用来解决这类问题的一种有效方法。方差分析就是检验同方差的若干正态母体均值是否相等的一种统计分析方法,它是在20世纪20年代由英国统计学家费希尔首先用到农业试验上去的。后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面.
第一节单因素的方差分析
在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素。因素分为两类,一类是人们可以控制的;一类是人们不可以控制的。以下我们所说的因素是可控因素,因素所处的状态称为该因素的水平。如果在一项试验中只有一个因素在改变,这样的试验我们称为单因素试验,如果多于一个因素在改变,就称为多因素试验。
本节就通过实例来讨论单因素试验。
某试验室对钢锭模进行选材试验。其方法是将试件加热到700°C,投入到20°C的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好。试验结果如表所示。
试验号
材质分类
A
1
2
3
4
5
6
7
8
160
161
165
168
170
172
180
158
164
164
170
175
146
155
160
162
164
166
174
182
151
152
153
157
160
168
试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异。
这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4种不同的材质表示钢锭模的4个水平,这项试验叫做4个水平单因素试验。
考察一种人造纤维在不同温度的水中浸泡后的缩水率,在40°C,50°C,…,90°C的水中分别进行4次试验,得到该种纤维在每次试验中的缩水率如表。试问浸泡水的温度对缩水率有无显著影响?
试验号
温度
40°C
50°C
60°C
70°C
80°C
90°C
1
2
3
4
这里试验指标是人造纤维的缩水率,温度是因素,这项试验为6水平单因素试验。
单因素实验的一般数学模型:因素A有s个水平A,A,…………,,在水平(j=1,2,…,s)下进行次独立试验,得到如下表的结果。
水平
观测值
A
…
样本总和
样本均值
总体均值
…
…
…
…
…
…
…
…
…
…
假定:各水平(j=1,2,…,s)下的样本~N(,) i=1,2, …, ,j=1,2,…,s,且相互独立。(分组总体)
故可看作是随机误差,它们是试验中无法控制的各种因素引起的。记
则
, i=1,2, …, ,j=1,2,…,s
~N(0,),各相互独立(9-1)
其中与均为未知参数。(9-1)式称为单因素试验方差分析。方差分析的任务是对于模型(9-1),检验s个总体N(,),…,N(,)的均值是否相等,即检验假设
:
: 不全相等(9-2)
引入=,其中,表示的加权平均,称为总平均。
表示水平下的总体平均值和总平均的差异****惯上将称为水平的效应。则模型(9-1)可改写为:
可分解总平均、水平的效应及随机误差3部分之和
=0,~N(0,),各独立,i=1,2, …, ,j=1,2,…,s
假设(9-2)等价于假设
:
: 不全为零
记
=
这里,能反映全部试验数据的差异,又称为总变差。
下的样本均值
由于
=
=
而
记=,,称误差平方和,称因素A的效应平方和,于是
=+
记,为随机误差的总平均,
于是=
=
注:①反映了实验过程中各种随机因素所引起的随机误差。
②反映了各组样本之间的差异程度,即由于因素A的不同水平所引起的系统误差。
③方差分析的目的是研究相对于有多大,若比显著地大,这表明各水平对指标的影响有显著差异,故需研究与有关的统计量。
当成立时,设~N(,) i=1,2, …, ,j=1,2,…,s,且相互独立,则有
,
于是,对于给定的显著性水平,由于
由此得检验问题的拒绝域
由样本值计算F的值,若,则拒绝,即认为水平的改变对指标有显著性的影响;若,则接受原假设,即认为水平的改变对指标无显著影响。
上面的