1 / 43
文档名称:

多元logistics回归分析.ppt

格式:ppt   页数:43页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多元logistics回归分析.ppt

上传人:xxj16588 2016/6/28 文件大小:0 KB

下载得到文件列表

多元logistics回归分析.ppt

文档介绍

文档介绍:多元 Logistics 回归分析李忠良华中科技大学同济医学院内容基本原理数学模型方法步骤系数解释条件 Logistics 分析应用内容基本原理数学模型方法步骤系数解释条件 Logistics 分析应用从数学角度看, logistic 回归模型非常巧妙地避开了分类型变量的分布问题,补充完善了线性回归模型和广义线性回归分析的缺陷。因变量 y 是分类型变量,自变量 x是与之有关的一些因素。但是,这样的问题却不能直接用线性回归分析方法来解决,其根本原因就在于因变量是分类型变量,严重违背了线性回归分析对数据的假设条件。从数学角度看,很难找到一个函数 y=f (x) ,当 x变化时,它对应的函数值y仅取两个或几个有限值。研究者将所要研究的问题转换了一个角度,不是直接分析 y与x的关系, 而是分析 y取某个值的概率 p与x的关系。分析因变量 y取某个值的概率 p与自变量 x的关系,等价于寻找一个连续函数 p=p(x) ,使得当 x变化时,它对应的函数值 p不超出[0,1] 范围。数学上这样的函数是存在且不唯一的, logistic 回归模型就是满足这种要求的函数之一。根据数据的类型, logistic 回归分析分为两种: 一种是条件 logistic 回归(conditional logistic regression) ,用于分析配对病例对照研究数据。另一种是非条件 logistic 回归(unconditional logistic regression) ,用于分析成组数据或非配对的病例对照研究。非条件 logistic 回归分析也简称为 logistic 回归分析。内容基本原理数学模型方法步骤系数解释条件 Logistics 分析应用 logistic 回归模型对变量的要求 Logistic 回归分析要求因变量是分类变量,包括顺序变量和名义变量。不论是哪种变量都要用数字来表示它的取值。自变量可以是数值型连续变量,也可以是顺序型分类变量,如果是名义变量,则需要转换成哑变量来处理。 logistic 回归模型的个数取决于因变量的取值个数。因为 logistic 回归模型描述的是因变量取每个值的概率与自变量的关系,因此因变量的每一个值都对应一个模型。但是由于概率之和为 1,所以当因变量是 g值变量时,只需要估计 g- 1个模型二值因变量的 logistic 回归模型假设因变量 y是一个取值为 1和0的二值变量(binary variable) ,x 是一个影响 y 的危险因子(risk factor) 。令在 x 条件下 y=1 的概率是 p=p(y=1| x) ,那么,表达式:??) exp( 1 exp 1 )1(x xe exypp x x?????????????????? 10 x p -α/β p=p(x) 图7- 1 变量 p与x 的关系多元 logistic 回归模型??) exp( 1 exp )1( 2211 2211kk xkxxx xxxxypp??????????????????????如果对模型的概率 p 进行 logit 变换??????????p pp it1 ln)( log logistic 回归模型的另一种形式,它给出的是变量 z=logit(p) 关于 x 的线性函数 kkxxxp pp it???????????????????? 22111 ln)( log 多值变量的 logistic 回归模型 kk jj jj xxxp pp it???????????????????? 22111 ln)( log p j = p( y ≤ j | x ) ,它表示了 y 取前 j 个值的累积概率(cumulative probability) 。累积概率函数????????????????????gj gjx xxjypp j j j当当,1 11,) exp( 1 ) exp( )(????第一个模型表示了 y 取第一个值的概率 p1 与x的关系;第二个模型表示了 y 取前两个值的累积概率 p2 与x的关系。这两个模型的常数项不同,回归系数完全相同的。 y 取第一个值的概率 p(1)=p1 ,y 取第二个值的概率 p(2)=p2 -p1 ,y 取第三个值的概率 p(3)=1- p2 。它们的截距不同,斜率相同,所以是 g-1 条平行直线族。多值因变量 logistic 回归模型要求进行数据的平行性检验。