文档介绍:logistic回归分析
表1 吸烟、饮酒与食管癌关系的病例对照调查资料
分层
吸烟
饮酒
阳性例数
阴性例数
观察例数
1
否
否
63
136
199
2
否
是
63
107
170
3
是
否
44
57
101
4
是
是
265
151
416
表1 吸烟、饮酒与食管癌关系的病例对照调查资料(收集资料的形式)
调查对象序号
吸烟
饮酒
食管癌
1
1
0
1
2
0
0
0
……
……
……
……
875
1
1
1
876
0
1
0
分类资料的影响因素分析方法
如果采用线性回归分析,应变量不满足条件,预测值会超出0和1的范围。
如果采用单变量的2检验,则必然忽略其他自变量对应变量的影响。
如果采用Mantel-Haenszel分层分析,需要较大的样本量,而且自变量不能太多。
logistic回归能较好地解决上述问题。
logistic回归模型
应变量Y是一个二值变量,取值为
自变量X1,X2,……,Xm。
P表示在m个自变量作用下事件发生的概率。
logistic回归模型
logistic回归模型
P
Z
logit变换
事件发生概率与未发生概率之比的自然对数,称为P的logit变换,记作logit(P)。
概率P的取值范围在0~1之间,而logit(P)取值是没有界限的。
logit变换
回归模型中参数的意义
0(常数项):所有影响因素均为 0 时(记作X=0),个体发生事件概率与不发生事件的概率之比的自然对数值。
j 的含义:某因素因素 Xj 改变一个单位时,个体发生事件概率与不发生事件的概率之比的自然对数变化值。