文档介绍:下列数据是研究镉作业工人暴露于烟尘的年数与
肺活量的关系。按暴露年数将工人分为两组:甲
组暴露≥10年,乙组暴露<10年。两组工人年龄
未经控制。问该两组暴露于镉作业工人平均肺活
量是否相同?
镉作业工人接触烟尘年数与肺活量的关系研究
甲组(暴露≥10年)
乙组(暴露<10年)
x1(年龄) y1(肺活量,L)
x2(年龄) y2(肺活量,L)
49
40
41
51
45
50
52
47
61
65
58
59
43
39
38
42
43
43
37
50
50
45
48
51
46
58
38
38
未经年龄校正时不同暴露年限的平均肺活量有差异(P=)
不同暴露年限的平均年龄也有差异P=
问题:不同暴露年限的平均肺活量有差异吗?
方差不齐用校正t检验
如何分析?
假设1:肺活量与暴露无关而与年龄有关?
假设2:肺活量与暴露、年龄均有关?
假设3:肺活量仅与暴露有关而与年龄无关?
假设4:肺活量与暴露、年龄均无关????
研究因素(变量):暴露年限
控制因素(变量):年龄
结局变量: 肺活量
在不同的暴露水平上肺活量与年龄均呈线性关系!
在不同的暴露水平上肺活量与年龄均呈线性关系!
直接比较不同暴露年限的平均肺活量显然不合理
如何分析比较:控制(或消除)年龄对肺活量的
线性影响后,再比较不同暴露年限的平均肺活量!
方法:协方差分析(线性回归+方差分析)
消除了年龄对肺活量的线性影响后,不同暴露年限的平均肺活量无统计学上的差异
一、协方差分析的意义
协方差是两个变量的协变异数,用COV(x,y)表示。
对于一个具有N对(x,y)的有限总体, x与y的协方差定义为双变量离均差乘积和的平均数,即:
对于具有n对观测值的样本,x与y的样本协方差COV(x, y)定义为双变量离均差乘积和与自由度的商,即:
样本协方差亦称为均积, 简记为MP,是总体协方差的估计值。
方差是用来度量单个变量“自身变异”大小的总体参数,方差越大,该变量的变异越大;
协方差是用来度量两个变量之间“协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。
对于仅涉及单个变量的试验资料,由于其总变异仅为“自身变异”(如单因素完全随机设计试验资料,“自身变异”是指由处理和随机误差所引起的变异),因而可以用方差分析法进行分析;
对于涉及两个变量的试验资料,由于每个变量的总变异既包含了“自身变异”又包含了“协同变异”(是指由另一个变量所引起的变异),须采用协方差分析法来进行分析,才能得到正确结论。