1 / 31
文档名称:

logistic回归(2)综述.ppt

格式:ppt   大小:2,419KB   页数:31页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

logistic回归(2)综述.ppt

上传人:今晚不太方便 2017/5/20 文件大小:2.36 MB

下载得到文件列表

logistic回归(2)综述.ppt

相关文档

文档介绍

文档介绍:第五章 Logistic 回归分析(二) 学****目标?了解 Logistic 回归模型的建立和假设检验; ?了解 Logistic 回归模型的应用领域; ?掌握 Logistic 回归模型系数的解释,及回归系数与 OR 值之间的关系; ?掌握 Logistic 回归过程步; ?掌握哑变量的设置和结果的解释; ?掌握多元 Logistic 回归模型的逐步过程法和系数的解释; ?了解条件 Logistic 回归的应用; ?掌握条件 Logistic 回归的 SAS 程序; 概述?线性回归模型和广义线性回归模型要求因变量是连续的正态分布变量, 且自变量和因变量呈线性关系。当因变量是分类型变量时,且自变量与因变量没有线性关系时,线性回归模型的假设条件遭到破坏。这时,最好的回归模型是 Logistic 回归模型,它对因变量的分布没有要求,从数学角度看, Logistic 回归模型非常巧妙地避开了分类型变量的分布问题, 补充完善了线性回归模型和广义线性回归模型的缺陷。从医学研究角度看, Logistic 回归模型解决了一大批实际应用问题,对医学的发展起着举足轻重的作用。非条件 Logistic 回归? Logistic 回归分析在医学研究中应用广泛。目前主要是用于流行病学研究中危险因素的筛选,但它同时具有良好的判别和预测功能,尤其是在资料类型不能满足 Fisher 判别和 Bayes 判别的条件时,更显示出 Logistic 回归判别的优势和效能。本研究对 Logistic 回归方程的判别分析进行了探讨,并用几个实例介绍其应用。非条件 Logistic 回归?医学研究中经常需要分析分类型变量的问题。比如,生存与死亡、有病与无病、有效与无效、感染与未感染等二分类变量。研究者关心的问题是, 哪些因素导致了人群中有些人患某种病而有些人不患某种病,哪些因素导致了某种治疗方法出现治愈、显效、好转和无效等不同的效果等。这类问题,实质上是一个回归问题,因变量就是上述提到的这些分类型变量,自变量 x是与之有关的一些因素。但是,这样的问题却不能直接用线性回归分析方法解决,其根本原因在于因变量是分类型变量,严重违背了线性回归分析对数据的假设条件。那么应该怎样解决这个问题呢? 非条件 Logistic 回归?研究者将所研究的问题转换一个角度,不是直接分析 y与x的关系,而是分析 y取某个值的概率 P与x的关系。例如,令 y为1,0变量, y=1 表示有病, y=0 表示未患病; x是与患病有关的危险因素。如果 P表示患病的概率,即 P =prob ( y=1 ),那么研究患病的概率 P与危险因素 x的关系就不是很困难的事情了。非条件 Logistic 回归?分析因变量 y取某个值的概率 P与自变量 x的关系,就是寻找一个连续函数,使得当 x 变化时,它对应的函数值 P不超出[0, 1]范围。数学上这样的函数是存在且不唯一的, Logistic 回归模型就是满足这种要求的函数之一。与线性回归分析相似, Logistic 回归分析的基本原理就是利用一组数据拟合一个 Logistic 回归模型,然后借助这个模型揭示总体中若干个自变量与一个因变量取某个值的概率之间的关系。具体地说, Logistic 回归分析可以从统计意义上估计出在其它自变量固定不变的情况下,每个自变量对因变量取某个值的概率的数值影响大小。? Logistic 回归模型有条件与非条件之分,前者适用于配对病例对照资料的分析,后者适用于队列研究或非配对的病例-对照研究成组资料的分析。问题的提出?在流行病学研究中,经常遇到因变量为离散型分类变量的情况。如治疗效果的无效好转、显效、痊愈;不同染毒剂量下小白鼠的存活或死亡;在某种暴露下的发病与不发病等。最常见的情况是因变量为二分变量的问题。?多元线性回归的局限性?经典流行病学统计分析方法—分层分析的局限性非条件 Logistic 回归介绍?根据 Logistic 函数的定义) exp( 1 ) exp( )1(x xxyPP??????????) exp( 1 11x P??????式中, P表示疾病发生的概率, 1-P 表示疾病不发生的概率, m????,,,, 21?是回归模型中的参数。非条件 Logistic 回归模型的建立?所谓参数估计,就是根据收集到的变量 x和y的观察值,估计回归系数和回归系数估计值的标准差。?在 Logistic 回归分析模型中,回归系数的估计方法通常是最大似然法。为了简单起见,下面仅以一元 Logistic 回归模型为例,说明回归系数a和b的估计方法。?在病例对照中,假设变量 y取值为 1和 0,1 表示患有胃癌, 0表示未患胃癌,变量 x也取值为 1和 0,1 表示饮酒, 0表示不饮酒。调查数据的频数列表和回顾性研究概率如下表所