1 / 53
文档名称:

Logistic回归与生存分析简介.ppt

格式:ppt   大小:2,561KB   页数:53页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Logistic回归与生存分析简介.ppt

上传人:fr520520 2019/6/20 文件大小:2.50 MB

下载得到文件列表

Logistic回归与生存分析简介.ppt

文档介绍

文档介绍:Logistic回归模型与生存分析简介**主要内容一、Logistic回归模型二、生存分析三、Assignments*张志杰,流行病学教研室,公共卫生学院,复旦大学*Logistic回归模型简介模型简介模型中参数的估计与意义模型与参数的假设检验模型的拟合优度Logistic回归模型中的高级话题分析实例*张志杰,流行病学教研室,公共卫生学院,复旦大学*模型简介方差分析模型:应变量-连续/正态;自变量:分类/连续变量线性回归模型:应变量-连续/正态;自变量:连续/分类变量应变量为分类变量:研究该分类变量与一组自变量之间的关系治愈/未治愈(0/1);治愈/好转/未治愈(有序分类);无序分类(腺癌、鳞癌、大细胞癌)研究的因素较少:χ2;CMH(无序分类变量;自变量为分类变量)研究的因素较多时(分层较多):出现较多0的单元Logistic回归模型单元为0的信息可以利用;自变量可以是连续性变量基于线性回归模型的思想发展而来*张志杰,流行病学教研室,公共卫生学院,复旦大学*模型简介应变量为0/1变量的Logistic回归模型在冠心病可疑危险因素的研究中,记录下每个研究对象的p个自变量(年龄、性别、饮酒等),记为x1,…,xp。随访一段时间,如果发生冠心病,应变量y记为1,如果没有发生冠心病,y=0。可以观察到,不同的x1,…,xp的研究对象,冠心病的发生概率P(y=1)不同,如果我们希望依据随访得到的这组数据建立一个描述自变量x1,…,xp与冠心病的发生概率P(y=1)间关系的回归方程,并根据建立的回归方程进行预测,对各个自变量的作用大小和方向作出评价,如何实现?我们首先想到的是能不能用线性回归模型来实现?*张志杰,流行病学教研室,公共卫生学院,复旦大学*:左边概率[0,1],右边[-∞,∞];:Logit变换应变量取值区间的变化<-问题1的解决P=0logitP=ln(0/1)=-∞P==ln()=0P=1logitP=ln(1/0)=+∞实践证明,logitP往往和自变量呈线性关系<-问题2的解决*张志杰,流行病学教研室,公共卫生学院,复旦大学*模型简介*张志杰,流行病学教研室,公共卫生学院,复旦大学*模型简介模型名称的来源:Logistic这个名称来源于它对应变量所采用的logit变换,和英文单词Logistic的含义(后勤的)一点关系都没有,与逻辑就更不相干模型用途筛选危险因素校正混杂因素预测与判别(判别分析)*张志杰,流行病学教研室,公共卫生学院,复旦大学*模型中参数的估计与意义模型参数的估计方法由于应变量为二分类,所以误差项服从二项分布,而非正态分布。最小二乘法不适用,最大似然法*张志杰,流行病学教研室,公共卫生学院,复旦大学*模型中参数的估计与意义模型中参数的意义β0-常数项自变量取值全为0时的基线状况,未必有实际意义;比数(Y=1与Y=0的概率之比)的自然对数值;病例—对照研究中,病例与对照两组人数的比例是人为定的,不能代表人群中真实的病人与正常人比例,因此该常数项不是各自变量取值为0时人群患病比的估计值的对数。因此根据病例—对照研究资料建立的Logistic回归模型中,常数项意义不大,主要针对结果中自变量的偏回归系数及其转换成OR值的意义作解释,不适宜直接用于预测和判别。如希望进行预测,则需知道人群中真实的患病率Pα。