1 / 93
文档名称:

3 逻辑回归分析PPT课件.ppt

格式:ppt   大小:2,095KB   页数:93页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

3 逻辑回归分析PPT课件.ppt

上传人:yzhluyin9 2017/11/23 文件大小:2.05 MB

下载得到文件列表

3 逻辑回归分析PPT课件.ppt

文档介绍

文档介绍:3 二项逻辑斯谛回归
返回
背景
现实世界,经常需要判断一些事情是否发生,候选人是否会当选,病患的几率,生意的成功与否
一般回归分析要求直接预测被解释变量的数值,而此处的被解释变量是二分变量
二项逻辑斯蒂回归模型针对具有两分特点的应变量的概率统计方法
问题:
利用多元回归方法分析变量之间关系或进行预测的前提是被解释变量连续定距
当被解释变量为0/1二值品质型变量时:
残差不再同方差,残差会随解释变量取值变化而变化
残差不再正态,是二值离散分布
被解释变量取值区间受限制
结论
当被解释变量为0/1,仍采用简单线性回归模型,则被解释变量的均值是取值为1的概率。以概率来建模
概率的取值范围0-1,而一般线性回归模型取值全体实数,需要转换
一般模型为线性,这里解释变量与概率值之间关系为非线性,与增长函数相吻合,采用非线性转换
转换
第一个模型是逻辑斯蒂回归模型 第三个为逻辑斯蒂函数,典型的增长函数,体现了概率和解释变量之间的非线性关系
只包含一个自变量的模型
Logistic回归曲线
数据要求
因变量具有二分特点,自变量可以是分类变量,也可以是定距型变量,如果是分类变量,应变为二分变量
分类编码的变化方式两种
自变量数据最好为多元正态分布,当观测量分组完全依据分组变量时,方法十分有效。
【1】指示变量编码方式
指示变量编码方式
当分类变量有三个水平,就要创建两个新的指示变量。
缺点:只能够比较每一类与参考类之间效应的差异
【2】背离编码方案
参照类被赋予了-1的编码值
每一个创建的新变量,其系数代表了与综合效果之间的差异,最后一类的值应该是前两种系数之和的相反数。