1 / 28
文档名称:

逻辑斯蒂回归模型PPT学习教案.pptx

格式:pptx   大小:266KB   页数:28页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

逻辑斯蒂回归模型PPT学习教案.pptx

上传人:wz_198613 2021/6/9 文件大小:266 KB

下载得到文件列表

逻辑斯蒂回归模型PPT学习教案.pptx

文档介绍

文档介绍:会计学
1
逻辑斯蒂回归模型
Logistic回归模型
对列联表的分析,独立性检验可以初步了解属性之间是否相互独立,或是否相关;通过列联表的相合性检验,可以进一步知道属性之间的相合情况,包括方向和程度; Logistic模型可以更进一步拟合属性变量之间的函数关系,以描述变量之间的相互影响。
列联表中的数据是以概率的形式把属性变量联系起来的,而概率p的取值在0与1之间,因此,要把概率 与 之间直接建立起函数关系是不合适的。即
第1页/共28页
Logistic回归模型
实践中, 通常随着 连续增长或连续下降,其直观的曲线形态是S型。
一般有这种形状的数学函数 有以下形式:
称作logistic回归函数。
把以上函数线性化可以得到:
第2页/共28页
Logistic回归模型
因此,人们通常把p的某个函数f(p)假设为变量的函数形式,取
称之为logit函数,也叫逻辑斯蒂变换。
因此,逻辑斯蒂变换是取列联表中优势的对数。当概率在0-1取值时,Logit可以取任意实数,避免了线性概率模型的结构缺陷。
类似的处理还有probit变换和双对数变换。
其中probit变换是将概率变换为标准正态分布的 值,形式为:
第3页/共28页
Logistic回归模型
双对数变换的形式为:
以上变换中以logit变换应最为广泛。
假设响应变量Y是二分变量,令 ,影响Y的因素有k个 ,则称:
为二分数据的逻辑斯蒂回归模型,简称逻辑斯蒂回归模型。其中的k个因素称为逻辑斯蒂回归模型的协变量。
第4页/共28页
Logistic回归模型
最重要的逻辑斯蒂回归模型是logistic线性回归模型,多元logit模型的形式为:
其中, 是待估参数。根据上式可以得到优势的值:
可以看出,参数 是控制其它 时 每增加一个单位对优势产生的乘积效应。
概率p的值:
第5页/共28页
Logistic回归模型
最简单的logit线性模型为:
则优势为:
以上指数关系说明: 每增加1个单位,优势变为原来的 倍;
此时的概率应为:
第6页/共28页
Logistic回归模型
多元logistic模型参数的估计
采用极大似然估计方法
假设n次观测中,对应 的观测有 个,其中观测值为1的有 个,观测值为0的有 个,则参数 的似然函数:
可以使用迭代法求出参数的ML估计
由于计算的复杂性,可以利用统计软件得到。
第7页/共28页
Logistic回归模型
【】一般认为,体质指数越大(BMI≥25),表示某人越肥胖。根据3983人的体检结果有388人肥胖,,试建立体质指数与患心血管病概率的logistic回归模型。
【解】根据题目知道是一元逻辑斯蒂回归问题。运用统计软件可以对参数进行估计得到:
于是logit模型为:
第8页/共28页
Logistic回归模型
由得到的模型可知,
患病概率为:
当体质指数BMI变化1单位时,,优势比将增加 即:
第9页/共28页