文档介绍:第七章 SPSS 方差分析本章内容? 方差分析概述? 单因素方差分析? 多因素方差分析? 协方差分析 方差分析概述 方差分析的作用在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的成本和收益,并选择最合理的种植方案,主动的在农作物种植过程中对各种影响因素加以准确控制,进而获得最理想的效果。 相关概念 1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的是实验过程中的抽样误差。 2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不同水平。如甲品种、乙品种; 10公斤化肥、 20公斤化肥、 30公斤化肥等。 3、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物的产量等。方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。控制因素观测变量三个水平 方差分析的原理方差分析认为,如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。建立在观测变量各总体服从正态分布和同方差的假设之上, 方差分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显著差异的推断问题了。综上所述,方差分析从对观测变量的方差分解入手,通过推断控制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量影响的程度进行剖析。根据控制变量的个数可将方差分析分为单因素方差分析、多因素方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因变量方差分析)和多元方差分析(多因变量方差分析)。 单因素方差分析 单因素方差分析的基本思想 1、定义:单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生显著影响;研究不同学历是否对工资收入产生显著影响等。 2、观测变量方差的分解将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别表示为: 其中, SST 为观测变量的总离差平方和; SSA 为组间离差平方和,是由控制变量不同水平造成的观测变量的变差; SSE 为组内平方和,是由抽样误差引起的观测变量的变差。 SSE SSA SST ??其中: ?????? ki nj ij ixx SST 11 2)(?????????? ki ki ii nj ixxnxx SSA i11 2 1 2)()(?????? ki nj i ij ixx SSE 11 2)(各离差平方和的计算-例题 824 824 824 887 887 938 827 848 基本工资 44433333职称 866 889 989 859 984 1014 1044 1014 基本工资 32222111职称 基本工资 Mean 高级工程师 Mean 工程师 Mean 助理工程师 Mean 无技术职称职称 Mean Total 3、比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响。这里我们用 F统计量来表示这种比例关系,如果控制变量的不同水平对观测变量造成了显著影响,那么观测