文档介绍:第六章试验设计与方差分析
一、试验设计初步。
    1 、试验及其模型;
    2 、处理设计:单因素试验、多因素试验;
    3 、试验误差:系统误差、随机误差、错失误差;
    4 、试验的排列:设置重复、随机化、区组化、拉丁方试验。
二、方差分析—ANOVA
    方差分析( analysis of variance , ANOVA )
    在研究一个变量时,能够解决多个总体的均值是否相等的检验问题;
    在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量影响的一种方法。
    1 .方差分析的内容
    首先我们对多个总体均值是否相等这一假设进行检验。
    例
    某饮料生产企业研制出一种新型饮料. 饮料的颜色共有四种: 橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收集了该种饮料的销售情况。
    该饮料在五家超市的销售情况:
超市
无色
粉色
橘黄色
绿色
1
2
3
4
5
均值
    进行方差分析:
    问题:饮料的颜色是否对销售量产生影响?
    在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验饮料颜色对销售量是否有影响?
    即:
    2 .方差分析的原理
    从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等,我们可用方差比较的方法来判断。
    首先,四种颜色的销售情况可看作为分为四个组:
颜色
组内平均数
组内平方和 SSA
组间平方和 SSE
无色
 
 
粉色
橘黄色
绿色
合计
-
总平方和 SST
    由此可知:差异的产生来自两个方面:
    一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了影响
    另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误差,如相同颜色的饮料在不同的商场销售量也不同。
    这两个方面产生的差异可以用两个方差来计量:
    一个称为水平之间(组间)方差( 组间平方和除以自由度(r-1) , r 为组数) ,一个称为水平内部(组内)方差(组内平方和除以自由度( n-1) , n 为样本容量总数)。
    水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方差就应该近似,从而应有:
    即,两个方差的比值就会接近于 1 。反之,水平之间的方差就会大于水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断,既不同的水平之间存在着显著差异。
    因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝原假设的判断。
    水平间的方差和水平内方差之比是一个统计量,这个统计量服从 F 分布:
 
    3 .方差分析的种类
    分析多个变量时,称为多元方差分析 Multivariate
    4 .应用方差分析的条件
    各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本;
    各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。
三、一元单因素方差分析
    例 中有一个变量和一个因素,即:变量 dependent variable :饮料的销售量;因素 factor :饮料的颜色。
    用 Spss 处理数据:
    Spss 数据:饮料的颜色
    Spss 选项: Analyze — Compare Mean — One-Way ANOVA
    SPSS 输出结果:
 
   SPSS 单因素方差分析的进一步分析
    Spss 单因