文档介绍:协方差分析第一节协方差分析的意义和功用方差分析(六) 下列数据是研究镉作业工人暴露于烟尘的年数与肺活量的关系。按暴露年数将工人分为两组:甲组暴露≥10年,乙组暴露<10 年。两组工人年龄未经控制。问该两组暴露于镉作业工人平均肺活量是否相同? 镉作业工人接触烟尘年数与肺活量的关系研究 43 39 38 42 43 43 37 50 50 45 48 51 46 58 38 38 49 40 41 51 45 50 52 47 61 65 58 59 x2( 年龄) y2( 肺活量, L) x1( 年龄) y1( 肺活量, L) 乙组(暴露<10 年) 甲组(暴露≥10年) 未经年龄校正时不同暴露年限的平均肺活量有差异(P=) 不同暴露年限的平均年龄也有差异 P= 问题:不同暴露年限的平均肺活量有差异吗? 方差不齐用校正 t检验如何分析? ?假设 1:肺活量与暴露无关而与年龄有关? ?假设 2:肺活量与暴露、年龄均有关? ?假设 3:肺活量仅与暴露有关而与年龄无关? ?假设 4:肺活量与暴露、年龄均无关???? 研究因素(变量):暴露年限控制因素(变量):年龄结局变量: 肺活量? ( y ? ?年龄) ? ( y ? ?年龄) 在不同的暴露水平上肺活量与年龄均呈线性关系! 在不同的暴露水平上肺活量与年龄均呈线性关系! 直接比较不同暴露年限的平均肺活量显然不合理如何分析比较:控制(或消除)年龄对肺活量的线性影响后,再比较不同暴露年限的平均肺活量! 方法:协方差分析(线性回归+方差分析) 消除了年龄对肺活量的线性影响后,不同暴露年限的平均肺活量无统计学上的差异一、协方差分析的意义协方差是两个变量的协变异数,用 COV(x,y) 表示。对于一个具有 N对(x,y) 的有限总体, x与y的协方差定义为双变量离均差乘积和的平均数,即: 1 ( , ) ( )( ) x y COV x y x y N ? ?? ???对于具有 n对观测值的样本, x与y的样本协方差 COV (x, y )定义为双变量离均差乘积和与自由度的商,即: 1 ( , ) ( )( ) 1 COV x y x x y y n ? ????样本协方差亦称为均积,简记为 MP, 是总体协方差的估计值。方差是用来度量单个变量“自身变异”大小的总体参数,方差越大,该变量的变异越大; 协方差是用来度量两个变量之间“协同变异”大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。