文档介绍:第四章第四章 Logistic Logistic 回归回归第一节从多元线性回归到 logistic 回归第二节 logistic 回归模型的建立第三节 logistic 回归结果的解释第四节 logistic 回归模型的检验第五节第五节研究实例研究实例参见郭志刚主编, 参见郭志刚主编, 《《社会统计分析方法社会统计分析方法——SPSS SPSS 软件应用软件应用》》第六章,中国人民大学出版社第六章,中国人民大学出版社 1999 1999 若我们所研究的因变量为分类变量时, 线性回归的假设条件往往不能成立。第一节从多元线性回归到 logistic 回归为什么需要应用 logistic 回归回顾:线性回归的主要条件 1、间距变量 2、自变量之间不能完全相关 3、关于误差项: (1)e与任何一个自变量无关,且均值为 0 (2)对应不同自变量 xi的各 ei有不变的方差(3)在各个观测自变量点 xi上的误差 ei之间无关(4) ei正态分布 OLS 求解前提高斯-马尔可夫假设统计推论的前提一、违反假定因变量为分类变量时,出现的主要问题: 以=a+bx为例对任一,y只能等于 0或者 1, 当y=0时, =0- 当y=1时, =1- ?y?y ?y Ei方差出现系统变动—— OLS 估计不是最佳 0e 0e 0x 二、线性概率模型( LPM )及其问题 1、实际情况 y为0、1,但线性回归方程结果不是如此 2、与实际情况不同(等速与变速) 自变量对因变量的作用是线性的将模型因变量理解为概率——在为只限于 0和1之间的概率选用模型时, LPM 不适合第二节 logistic 回归模型的建立要考虑的情况: 1、自变量的影响两端小而中间大 2、概率模型(因变量总是取 0或1) 选择曲线模型更合适(Logistic 回归) 一、 logistic 函数及其性质又称增长函数 Robert B. Pearl and Lowell J. Reed 果蝇口研究 1920 t:时间 P:时间 t上的人口数 L:P的最大极限值 a和b 分别为有关参数 P 1 exp[ ( )] L a bt ?? ?? exp(x )用来计算以 e为底的 x次方值补充:有关数学知识?定义形如的函数叫幂函数,其中α为常数?指数函数, (a>0,且 a≠1),注意与幂函数的区别. ?对数函数 y= (a>0,且 a≠1). ?指数函数与对数函数 y= 互为反函数. ayx ? xya ? log xaxya ? log xa ?(2) 指数函数与对数函数的图象和性质如表 1-2 . ?一般对数的底可以为任意不等于 1的正数。?对数的底如果为超越数 e(e =) ,我们就把这样的对数叫作自然对数,用符号“ ln”表示。?“1”是对数“ logarithm ”的第一个字母, “n”是自然“ nature ”的第一个字母,把两个字母合在一起,就表示自然对数。? ln1=0 ? ln100= ?“ lg”表示以 10为底的对数 01e ? 100 e ?