文档介绍:Logistic Regression Analysis Logistic回归分析
邓文丽江西师范大学
2010年7月12日
问题背景
在医学研究中, 经常要分析某种结果的产生与哪些因素有关。例如:生存与死亡, 发病与未发病, 阴性与阳性等结果的产生可能与病人的年龄、性别、生活****惯、体质、遗传等许多因素有关。如何找出其中哪些因素对结果的产生有显著性影响。 Logistic回归分析能较好地解决这类问题。
一、 Logistic回归模型
1、 Logistic回归模型的构造
若因变量y为连续型正态定量变量时, 可采用多元线性回归分析y与变量 X1, X2, …, Xp之间的关系: y=β0+β1X1+β2X2+…+βpXp
现y为发病或未发病,生存与死亡等定性分类变量,不能直接用上模型进行分析。
能否用发病的概率P来直接代替 y呢?
p=β0+β1X1+β2X2+…+βpXp
等式左边变化范围
P 发病概率 0≤ P≤1
1-P 不发病概率 0≤ P≤1
p/1-p 比数(ratio) 0 ≤ p/1-p<+∞
ln(p/1-p) 对数比(ratio) -∞< ln(p/1-p) <+∞
2、 Logistic 回归模型
ln[P/(1-P)]=β0+β1X1+…+βpXp.
定义:logit(P)= ln[P/(1-P)]为 Logistic变换, Logistic 回归模型为:
logit(P)=β0+β1X1+…+βpXp ;
经数学变换可得:
exp(β0+β1X1+…+βpXp)
P= ─────────────
1+ exp(β0+β1X1+…+βpXp);
exp表示指数函数。
Logistic回归模型是一种概率模型, 它是以疾病,死亡等结果发生的概率为因变量, 影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项, 多项分类的资料。
在临床医学中多用于鉴别诊断, 评价治疗措施的好坏及分析与疾病预后有关的因素等。
4 、回归系数βi的意义
设只有一个自变量X,Logistic方程为
ln P/(1-P)= β0 + β1 X
设,X= 1 表示暴露, 0 表示非暴露。
X=1时,发病概率为 P1;
X=0时,发病概率为 P0。
P1/(1-P1)
则优势比 OR= ──────
P0/(1-P0)
ln(OR)=ln[P1/(1-P1)]-ln[P0/(1-P0)]
=(β0+β1×1)-(β0+ β1 ×0)
= β1