文档介绍:第十五章 logistic回归分析
Logistic Regression Analysis
山东大学公共卫生学院
回归分析的分类
连续型因变量(y) --- 线性回归分析
一个分类型因变量(y) ---Logistic 回归分析
因变
量 y 生存时间因变量(t) ---生存风险回归分析
时间序列因变量(t) ---时间序列分析
多个因变量路径分析
(y1,y2,…yk) 结构方程模型分析
• logistic回归(logistic regression)是研究因变量为二分类或
多分类观察结果与影响因素(自变量)之间关系的一种多
变量分析方法,属概率型非线性回归。
•在流行病学研究中,常需要分析疾病与各种危险因素间的
定量关系,同时为了能真实反映暴露因素与观察结果间的
关系,需要控制混杂因素的影响。
(1)Mantel-Haenszel分层分析:适用于样本量大、分析因
素较少的情况。当分层较多时,由于要求各格子中例数不
能太少,所需样本较大,往往难以做到;当混杂因素较多
时,分层数也呈几何倍数增长,这将导致部分层中某个格
子的频数为零,无法利用其信息。
(2)线性回归分析:由于因变量是分类变量,不能满足
其正态性要求;有些自变量对因变量的影响并非线性。
logistic回归:不仅适用于病因学分析,也可用于其他方面的研究,研
究某个二分类(或无序及有序多分类)目标变量与有关因素的关
系。
logistic回归的分类:
(1)二分类资料logistic回归: 因变量为两分类变量的资料,可用非
条件logistic回归和条件logistic回归进行分析。非条件logistic回归
多用于非配比病例-对照研究或队列研究资料,条件logistic回归多
用于配对或配比资料。
(2)多分类资料logistic回归: 因变量为多项分类的资料,可用多项
分类logistic回归模型或有序分类logistic回归模型进行分析。
•队列研究(cohort study):也称前瞻性研究、随访研究等。是一种由因及果
的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人
群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死
亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾
病间存在联系。队列研究验证的暴露因素在研究开始前已存在,研究者知
道每个研究对象的暴露情况。
调查方向:追踪收集资料
暴露疾病人数比较
a
+ a/(a+b)
+
- b
研究人群
+ c
- c/(c+d)
- d
队列研究原理示意图
病例非病例合计发病率
暴露组 a b n1=a+b a/ n1
非暴露组 c d n0=c+d c/ n0
相对危险度(relative risk, RR)也称危险比(risk ratio)
I e a /n1
或率比(rate ratio)。 RR 、 I e a / n1 、 I 0 c / n2
I 0 c / n0
RR(相对危险度relative risk):表示暴露组与非暴露组
发病率(或死亡率)的比值。也称为危险比(risk ratio)。
反映了暴露与疾病发生的关联强度。
RR表明暴露组发病或死亡的危险是非暴露组的多少倍。
•病例对照研究(case-control studies):一种由果及因的回顾性
研究,先按疾病状态确定调查对象,分为病例(case)和对照
(control)两组,然后利用已有的记录、或采用询问、填写调查表
等方式,了解其发病前的暴露情况,并进行比较,推测疾病与
暴露间的关系。
调查方向:收集回顾性资料
比较人数暴露疾病
a +
a/(a+b) 病例
b -
c +
c/(c+d) 对照
d -
病例对照原理示意图
是否暴露病例对照合计
暴露组 a b a+b(n1)
未暴露组 c d c+d(n2)
合计 a+c b+d n
比数比(odds ratio、OR):病例对照研究中表示疾病与暴露间
联系强度的指标,也称比值比。
比值(odds):某事物发生的可能性与不发生的可能性之比。
病例组暴露的比值 a /(a b) 、对照组暴露的比值 c /(c d)
b /(a b) d /(c d)
ad
该暴露因素的优势比:OR = a/( a b ) c /( c d )
b/( a b