文档介绍:第十二章卡方检验(一)
用于检验:
1)两组或几组率或构成比的差异有无显著性
2)各行的平均分间有无差异
3)行与列两个顺序分类变量之间是否相关
4)拟合优度检验
第一节四格表资料的2检验
以P153例12-1为例
1、四格表:将资料列成表格,表格中四个数字是基本的:63、17、31、68,称四格表fourfold table
2、实际数:表内各格数字为实际资料的数字,称observed value, actual frequency,记为O或A
两样本率不同的原因:抽样误差、总体率确实不同
两种类型胃溃疡病内科疗法治疗结果
为检验是否为第二种情况,无效假设为两种治愈率本无不同,差别仅由抽样误差所致。
3、理论治愈率:
根据两组治愈率相同的假设,合计治疗179人,总治愈94人,得理论治愈率为 94/179=%
4、理论数:
一般溃疡患者80,按理论治愈率应治愈80×%=,称theoretical value, theoretical frequency. 记为T。同理可得其余理论数。亦可由减法求得
Trc=(nrnc)/n:理论数为行合计乘列合计除总合计
理论数有两个特征:1)理论频数表的构成比相同,即不但各行构成比相同,而且各列亦相同;2)各个基本格子实际数与理论数的差别(绝对值)相同
5、样本率的差别演绎为实际数与理论数的差别:
两样本率相差愈大,则实际数与理论数的差别就愈大。若无效假设成立,实际数与理论数之差就不会很大。
1)实际数与理论数之间的差别等价于两样本率的差别
2)检验假设H0:四格表的构成比相同,等价于H0:两总体率相等
3)对实际数与理论数差值的假设检验,等价于对两样本率差值的假设检验
6、2检验的基本思想(及计算步骤)
1)假设两总体率相等(构成比相同)
HO:1=2,即两总体阳性率相等
H1:12,即两总体阳性率不等
=
不妨把H0看作:1=2=两样本合并的阳性率
2)实际数与理论数的差值服从2分布,又称pearson 2 :
2值是以理论数为基数的相对误差,它反映了实际数与理论数吻合的程度(差别的程度)。若检验假设成立,则实际数与理论数的差别不会很大,出现大的2值的概率是很小的,若P,就怀疑假设,因而拒绝它;若P>,则尚无理由拒绝它
2值的大小随着格子数的增加而变大,即2分布与自由度有关。因而考虑2值大小的意义时,要考虑到格子数。当周边合计数固定的情况下,四个基本数据当中只有一个可以自由取值,即自由度为1。
=(R-1)(C-1)
R行C列时,R行中有一行数据受到列合计的限制而不能自由变动,C列中亦有一列数据在行合计的限制下不能自由取值
3)查2分布界值表确定P值并作出推论
2 =,自由度为1,查附表6-7
2 (1)=; 2 (1) =; 2 (1) =
一般类型的治愈率高于特殊类型(结合样本率作实际推论)
P<, 按=,拒绝H0接受H1,因而认为两总体的阳性率有差别(统计学推论)。结果说明,两组胃溃疡病人治愈率的差别有高度统计意义,
7、2值的校正、四格表2检验的条件
实际上2值是根据正态分布中2 =[(xi-) /]2的定义计算出来的,用前述公式算得的值只能说近似于2分布,在自由度大于1,理论数皆大于5时,这种近似较好;自由度为1,当有理论数小于5时,需进行(连续性)校正