文档介绍:Logistic 回归模型
赵耐青
复旦大学公共卫生学院
1
数据分析的背景
计量资料单因素统计分析
对于两组计量资料的比较,一般采用t检验或秩和检验。
对于两个变量的相关分析采用Pearson相关分析或Spearman相关分析
考虑多因素的影响,对于应变量(反应变量)为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。
2
数据分析的背景
单因素的分类资料统计分析,一般采用Pearson 2进行统计检验,用Odds Ratio及其95%可信区间评价关联程度。
考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型P=a+bx就不合适了,应选用Logistic回归模型进行统计分析。
3
Logistic回归模型
按研究设计分类
非配对设计:非条件Logistic回归模型
配对的病例对照:条件Logistic回归模型
按反应变量分类
二分类Logistic回归模型(常用)
多分类无序Logistic回归模型
多分类有序Logistic回归模型
4
基础知识
通过下例引入和复****相关概念
例如:研究患某疾病与饮酒的关联性
患病率 P1=a/m1 P2=b/m2
5
基础知识
Odds(优势)
P越大,则Odds越大;P越小,则Odds越小
并且 0<Odds<+
6
基础知识
P与Odds一一对应
对于两个Odds的比较,一般用它们的Ratio,并称为Odds Ratio(OR),其定义如下:
其样本估计统计量为
7
基础知识
故比较两个率<==>
比较OR =1? OR>1 ? OR<1?
8
(二分类)Logistic回归模型
因为0<Odds<+
所以-< ln(Odds) <+
对ln(Odds)引入类似多重线性回归的表达式
9
Logistic回归模型
记:
故可以写为
也可以写为
10