文档介绍：所谓 Logistic 模型,或者说 Logistic 回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在 0~1 之间,回归方程的应变量取值可是在实数集中,直接做会出现 0~1 范围之外的不可能结果,因此就有人耍小聪明, 将率做了一个 Logit 变换, 这样取值区间就变成了整个实数集, 作出来的结果就不会有问题了,从而该方法就被叫做了 Logistic 回归。随着模型的发展, Logistic 家族也变得人丁兴旺起来,除了最早的两分类 Logistic 外,还有配对 Logistic 模型, 多分类 Logistic 模型、随机效应的 Logistic 模型等。由于 SPSS 的能力所限, 对话框只能完成其中的两分类和多分类模型,下面我们就介绍一下最重要和最基本的两分类模型。界面详解与实例例某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中, 收集了一批行根治性肾切除术患者的肾癌标本资料, 现从中抽取 26 例资料作为示例进行 logistic 回归分析( 本例来自《卫生统计学》第四版第 11章)。 i :标本序号 x1 :确诊时患者的年龄(岁) x2 :肾细胞癌血管内皮生长因子(VEGF) ,其阳性表述由低到高共 3 个等级 x3 :肾细胞癌组织内微血管数(MVC) x4 :肾癌细胞核组织学分级,由低到高共 4级 x5 :肾细胞癌分期,由低到高共 4期 y :肾细胞癌转移情况( 有转移 y=1; 无转移 y=0) 。 I x1 x2 x3 x4 x5y 1 592 210 2 361 110 3 612 190 210 4 583 128 431 5 553 80341 6 611 210 7 381 76110 8 421 240 320 9 501 74110 10 583 220 11 683 420 12 252 431 13 521 56110 14 311 210 15 363 311 16 421 210 17 143 331 18 321 114230 19 351 210 20 703 431 21 652 441 22 452 124 240 23 683 331 24 312 230 25 581 128 430 26 603 431 在菜单上选择 Analyze== 》 Regression== 》 Binary Logistic... ,系统弹出 Logistic 回归对话框如下: 左侧是候选变量框,右上角是应变量框,选入二分类的应变量,下方的 Covariates 框是用于选入自变量的,只不过这里按国外的****惯被称为了协变量。两框中间的是 BLOCK 系列按扭, 我在上一课已经讲过了, 不再重复。中下部的>a*b> 框是用于选入交互作用的,和其他的对话框不太相同(我也不知道为什么 SPSS 偏在这里做得不同), 下方的 Method 列表框用于选择变量进入方法, 有进入法、前进法和后退法三大类, 三类之下又有细分。最下面的四个按钮比较重要,请大家听我慢慢道来: Select>> 钮: 用于限定一个筛选条件, 只有满足该条件的记录才会被纳入分析, 单击它后对话框会展开让你填入相应的条件。不过我觉得该功能纯属多余,和专门的 Select 对话框的功能重复了。 Categorical 钮: 如果你的自变量是多分类的( 如血型等), 你必须要将它用哑变量的方式来分析, 那么就要用该按钮将该变量指定为分类变量,如果有必要,可用里面的选择按钮进行详细的定义,如以哪个取值作为基础水平,各水平间比较的方法是什么等。当然,如果你弄不明白,不改也可以,默认的是以最大取值为基础水平,用 Deviance 做比较。 Save 钮:将中间结果存储起来供以后分析,共有预测值、影响强度因子和残差三大类。 Options 钮: 这一部分非常重要, 但又常常被忽视, 在这里我们可以对模型作精确定义, 还可以选择模型预测情况的描述方式,如 Statistics and Plots 中的 Classification plots 就是非常重要的模型预测工具, Correlations of estimates 则是重要的模型诊断工具, Iteration history 可以看到迭代的具体情况,从而得知你的模型是否在迭代时存在病态,下方则可以确定进入和排除的概率标准,这在逐步回归中是非常有用的。好,根据我们的目的,应变量为 Y ,而 X1~X5 为自变量,具体的分析操作如下: Analyze== 》 Regress