文档介绍:logistic回归
主讲人:王静
单位:安徽医科大学公卫学院流统系
2
资料背景
D
队列研究 E D 计算各组人群的发病率,
E D 并估计相对危险度RR。
D
E
病例-对照研究E D 计算各组人群的暴露比例,
E 并计算OR。
E D
欲分析暴露E对疾病D有无影响,可以将D作为y、E作为x。
3
序号
性别
年龄
学历
吸烟
Y
1
1
60
2
2
1
1
1
0
2
1
48
3
2
1
1
1
0
3
2
63
2
1
1
1
2
0
4
1
68
3
2
2
1
1
0
5
1
45
2
1
2
1
1
0
6
1
45
3
3
2
1
1
0
……………
118
1
62
1
2
2
2
1
1
119
1
55
4
2
2
2
2
1
120
1
67
5
2
2
2
1
1
121
1
65
1
2
2
2
1
1
糖尿病与血压、血脂等因素的关系研究的数据
4
logistic回归
模型简介
传统方法与logistic回归的关系
回归系数的解释
模型的估计与假设检验
建模策略
5
计量资料=计量、等级、分类
二分类资料=计量、等级、分类
?
6
1 模型简介
发病的概率P, 0≤P≤1。
Cox(1970) logit变换
logit P = ln [P/ (1- P)]
-∞<logit P<+∞
?
7
logistic回归模型
为“机会”或“优势”(odds)
logit P为优势之对数(log odds)
8
logistic回归模型的几种形式
9
2. 传统四格表资料与logistic的关系
探讨妇女使用雌激素与患子宫内膜癌的病例-对照研究
雌激素
使用过未使用过
病例
55(a)
128(b)
对照
19(c)
164(d)
10
四格表资料的logistic回归——单因素logistic回归
X=1 表示使用过雌激素
X=0 表示未使用过雌激素