文档介绍:方差分析
你现在浏览的是第一页,共99页
适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验。
多个处理平均数的显著性检验该如何进行呢?
方差分析 !!!
t 检 验
你现在浏览的是第二页,共99页
在因素的不同水平(不同总体)下,各观察值之间的差异
比如,同一家超市,不同颜色饮料的销售量也是不同的
这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差
方差分析的基本思想和原理(两类误差)
你现在浏览的是第八页,共99页
组内方差
因素的同一水平(同一个总体)下样本数据的方差
比如,某一种饲料对猪的增重的方差
组内方差只包含随机误差
组间方差
因素的不同水平(不同总体)下各样本之间的方差
比如,A1、A2、A3、A4四种饲料对猪增重之间的方差
组间方差既包括随机误差,也包括系统误差
方差分析的基本思想和原理(两类方差)
你现在浏览的是第九页,共99页
如果不同饲料(水平)对猪增重(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1
如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1
当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异
方差分析的基本思想和原理(方差的比较)
组间变异
总变异
组内变异
你现在浏览的是第十页,共99页
效应是可加的(效应的可加性)
每个总体都应服从正态分布(分布的正态性)
对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本
比如,每种颜色饮料的销售量必需服从正态分布
各个总体的方差必须相同(方差的同质性)
对于各组观察数据,是从具有相同方差的总体中抽取的
比如,四种颜色饮料的销售量的方差都相同
观察值是独立的
比如,每个超市的销售量都与其他超市的销售量独立
方差分析中的基本假定
对其取离均差形式:
两边各取平方并求其总和,得平方和为:
你现在浏览的是第十一页,共99页
在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题
如果四个总体的均值相等,可以期望四个样本的均值也会很接近
四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分
样本均值越不同,我们推断总体均值不同的证据就越充分
方差分析中的基本假定
你现在浏览的是第十二页,共99页
如果原假设成立,即H0:
四种颜色饮料销售的均值都相等
没有系统误差
这意味着每个样本都来自均值为、差为2的同一正态总体
方差分析中基本假定
X
f(X)
1 2 3 4
你现在浏览的是第十三页,共99页
如果备择假设成立,即H1: μi (i=1,2,3,4)不全相等
至少有一个总体的均值是不同的
有系统误差
这意味着四个样本分别来自均值不同的四个正态总体
方差分析中基本假定
X
f(X)
3 1 2 4
你现在浏览的是第十四页,共99页
第一节 基本假定和数据转换
你现在浏览的是第十五页,共99页
第一节 基本假定和数据转换
一、各处理重复数相等的方差分析
各处理的重复数 相等(即 )是方差分析中最简单的一种数据结构。方差分析是将所有试验观测值的总变异(总方差)依据变异的原因加以分解,进而分析各变异原因的主次,而数据变异性的分解是通过对总平方和与总自由度的分解来实现的。
在表中,全部观测值 的总平方和是各观测值与总平均数 的离均差平方和,记为 :
你现在浏览的是第十六页,共99页
第一节 基本假定和数据转换
其中
所以
因为
你现在浏览的是第十七页,共99页
第一节 基本假定和数据转换
上式中, 是各处理均数 与总平均数 的离均差平方和与重复数 的乘积,反映了重复 次的处理间的变异,称为处理间平方和,记为 。即
而 则是各处理内离均差平方和之和,反映了各处理内的变异(即误差),称为处理内平方和或误差平方和,记为 。即
你现在浏览的是第十八页,共99页