1 / 41
文档名称:

精品PPT课件----第11章 Logistic回归分析.ppt

格式:ppt   页数:41
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

精品PPT课件----第11章 Logistic回归分析.ppt

上传人:wz_198614 2014/9/29 文件大小:0 KB

下载得到文件列表

精品PPT课件----第11章 Logistic回归分析.ppt

文档介绍

文档介绍:第11章 Logistic回归分析
学习目标
了解Logistic回归模型的建立和假设检验;
了解Logistic回归模型的应用领域;
掌握Logistic回归模型系数的解释,及回归系数与OR值之间的关系;
掌握Logistic回归过程步;
掌握哑变量的设置和结果的解释;
掌握多元Logistic回归模型的逐步过程法和系数的解释;
了解条件Logistic回归的应用;
掌握条件Logistic回归的SAS程序;
概述
线性回归模型和广义线性回归模型要求因变量是连续的正态分布变量,且自变量和因变量呈线性关系。当因变量是分类型变量时,且自变量与因变量没有线性关系时,线性回归模型的假设条件遭到破坏。这时,最好的回归模型是Logistic回归模型,它对因变量的分布没有要求,从数学角度看,Logistic回归模型非常巧妙地避开了分类型变量的分布问题,补充完善了线性回归模型和广义线性回归模型的缺陷。从医学研究角度看,Logistic回归模型解决了一大批实际应用问题,对医学的发展起着举足轻重的作用。
非条件Logistic回归
Logistic回归分析在医学研究中应用广泛。目前主要是用于流行病学研究中危险因素的筛选,但它同时具有良好的判别和预测功能,尤其是在资料类型不能满足Fisher判别和Bayes判别的条件时,更显示出Logistic回归判别的优势和效能。本研究对Logistic回归方程的判别分析进行了探讨,并用一实例介绍其应用。
非条件Logistic回归
医学研究中经常需要分析分类型变量的问题。比如,生存与死亡、有病与无病、有效与无效、感染与未感染等二分类变量。研究者关心的问题是,哪些因素导致了人群中有些人患某种病而有些人不患某种病,哪些因素导致了某种治疗方法出现治愈、显效、好转和无效等不同的效果等。这类问题,实质上是一个回归问题,因变量就是上述提到的这些分类型变量,自变量x是与之有关的一些因素。但是,这样的问题却不能直接用线性回归分析方法解决,其根本原因在于因变量是分类型变量,严重违背了线性回归分析对数据的假设条件。那么应该怎样解决这个问题呢?
非条件Logistic回归
研究者将所研究的问题转换一个角度,不是直接分析y与x的关系,而是分析y取某个值的概率P与x的关系。例如,令y为1,0变量,y=1表示有病,y=0表示未患病;x是与患病有关的危险因素。如果P表示患病的概率,即P=prob(y=1),那么研究患病的概率P与危险因素x的关系就不是很困难的事情了。
非条件Logistic回归
分析因变量y取某个值的概率P与自变量x的关系,就是寻找一个连续函数,使得当x变化时,它对应的函数值P不超出[0,1]范围。数学上这样的函数是存在且不唯一的,Logistic回归模型就是满足这种要求的函数之一。与线性回归分析相似,Logistic回归分析的基本原理就是利用一组数据拟合一个Logistic回归模型,然后借助这个模型揭示总体中若干个自变量与一个因变量取某个值的概率之间的关系。具体地说,Logistic回归分析可以从统计意义上估计出在其它自变量固定不变的情况下,每个自变量对因变量取某个值的概率的数值影响大小。
Logistic回归模型有条件与非条件之分,前者适用于配对病例对照资料的分析,后者适用于队列研究或非配对的病例-对照研究成组资料的分析。
问题的提出
在流行病学研究中,经常遇到因变量为离散型分类变量的情况。如治疗效果的无效好转、显效、痊愈;不同染毒剂量下小白鼠的存活或死亡;在某种暴露下的发病与不发病等。最常见的情况是因变量为二分变量的问题。
多元线性回归的局限性
经典流行病学统计分析方法—分层分析的局限性

1)病历对照研究
2)队列研究
(疾病)和暴露(因素)联系强弱的指标
1) 相对危险度:RR = p1 / p0
p1: 暴露于某个危险因素下发病的概率
p0: 不暴露于某个危险因素下发病的概率(对照)
2)比值比:
OR = {P(D=1|E=1)/P(D=0|E=1)} / {P(D=1|E=0)/P(D=0|E=0)}
D=1: 患某种疾病, D=0:不患某种疾病
E=1: 暴露于某个危险因素, E=0: 不暴露于某个危险因素
可以简单地表述成:OR = (p1 / q1) / (p0 / q0)
p1 : 暴露于某个危险因素下发病的概率
q1 : 暴露于某个危险因素下不发病的概率
p0 : 不暴露于某个危险因素下发病的概率
q0 : 不暴露于某个危险因素下不发病的概率