1 / 15
文档名称:

二分类及多分类Logistic回归模型.docx

格式:docx   大小:263KB   页数:15页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

二分类及多分类Logistic回归模型.docx

上传人:雨林书屋 2022/1/9 文件大小:263 KB

下载得到文件列表

二分类及多分类Logistic回归模型.docx

文档介绍

文档介绍:精品文档
精品文档
1
精品文档
二分类Logistic回归模型
在对资料进行统计分析时常遇到反应变量为分类变量的资料,那么,能否用类似于线
性回归的模型来对这种资料进行分析呢?答案是肯定的。本章将向大家介绍对二分类因变量进行回归建模的Logistic回归模型。
第一节 模型简介
一、模型入门
在很多场合下都能碰到反应变量为二分类的资料,如考察公司中总裁级的领导层中是
否有女性职员、某一天是否下雨、某病患者结局是否痊愈、调查对象是否为某商品的潜在消费者等。对于分类资料的分析,相信大家并不陌生,当要考察的影响因素较少,且也为分类
变量时,分析者常用列联表
(contingencyTable)的形式对这种资料进行整理,并使用
2检验
来进行分析,汉存在分类的混杂因素时,
还可应用Mantel-Haenszel
2检验进行统计学检验,
这种方法可以很好地控制混杂因素的影响。
但是这种经典分析方法也存在局限性,
首先,它
虽然可以控制若干个因素的作用,
但无法描述其作用大小及方向,
更不能考察各因素间是否
存在交互任用;其次,该方法对样本含量的要求较大,当控制的分层因素较多时,
单元格被
划分的越来越细,列联表的格子中频数可能很小甚至为
0,将导致检验结果的不可靠。最后,
检验无法对连续性自变量的影响进行分析,而这将大大限制其应用范围,无疑是其致使
的缺陷。
那么,能否建立类似于线性回归的模型,对这种数据加以分析?以最简单的二分类因
变量为例来加以探讨,为了讨论方便,常定义出现阳性结果时反应变量取值为 1,反之则取
值为

0

。例如当领导层有女性职员、下雨、痊愈时反应变量

y 1,而没有女性职员、未下
精品文档
精品文档
15
精品文档
雨、未痊愈时反应变量

y 0。记出现阳性结果的频率为反应变量

P(y

1)。
精品文档
精品文档
15
精品文档
首先,回顾一下标准的线性回归模型:
精品文档
精品文档
15
精品文档
Y

1x1

mxm
精品文档
精品文档
15
精品文档
如果对分类变量直接拟合,则实质上拟合的是发生概率,参照前面线性回归方程

,很
精品文档
精品文档
15
精品文档
自然地会想到是否可以建立下面形式的回归模型:
P 1x1 mxm
显然,该模型可以描述当各自变量变化时,因变量的发生概率会怎样变化,可以满足
分析的基本要求。实际上,统计学家们最早也在朝这一方向努力,并考虑到最小二乘法拟合时遇到的各种问题,对计算方法进行了改进,最终提出了加权最小二乘法来对该模型进行拟合,至今这种分析思路还偶有应用。
既然可以使用加权最小二乘法对模型加以估计,为什么现在又放弃了这种做法呢?原因在于有以下两个问题是这种分析思路所无法解决的:
精品文档
精品文档
15
精品文档
(1)取值区间:上述模型右侧的取值范围,或者说应用上述模型进行预报的范围为整
个实数集(
,),而模型的左边的取值范围为
0P1,二者并不相符。模型本身不能
保证在自变量的各种组合下,因变量的估计值仍限制在
0~1内,因此可能分析者会得到这
种荒唐的结论:男性、30岁、病情较轻的患者被治愈的概率是
300%!研究者当然可以将此
结果等价于
100%可以治愈,但是从数理统计的角度讲,这种模型显然是极不严谨的。
(2)曲线关联:根据大量的观察,反应变量
P与自变量的关系通常不是直线关系,而
是S型曲线关系。这里以收入水平和购车概率的关系来加以说明,当收入非常低时,收入
的增加对购买概率影响很小;但是在收入达到某一阈值时,
购买概率会随着收入的增加而迅
速增加;在购买概率达到一定水平,绝大部分在该收入水平的人都会购车时,
收入增加的影
响又会逐渐减弱。如果用图形来表示,则如图
1所示。显然,线性关联是线性回归中至关重
要的一个前提假设,而在上述模型中这一假设是明显无法满足的。
图1S型曲线图
以上问题促使统计学家们不得不寻求新的解决思路,如同在曲线回归中,往往采用变
量变换,使得曲线直线化,然后再进行直线回归方程的拟合。 那么,能否考虑对所预测的因
变量加以变换,以使得以上矛盾得以解决?基于这一思想, 又有一大批统计学家在寻找合适
的变换函数。终于,在 1970年,Cox引入了以前用于人口学领域的 Logit 变换(Logit
Transformation),成功地解决了上述问题。
那么,什么是Logit变换呢?通常的把出

最近更新

2024年精喹禾灵项目资金筹措计划书代可行性研.. 67页

2024年磁性载体材料项目资金筹措计划书代可行.. 62页

2024年石膏矿项目投资申请报告代可行性研究报.. 67页

2024年眼药水项目资金筹措计划书代可行性研究.. 71页

2024年甾体药物项目投资申请报告代可行性研究.. 80页

一年级下册语文暑假作业(人教版) 4页

一年级下册品德教案看电视(3) 鲁人版 3页

二年级下册语文《三个儿子》评课稿 6页

二年级上:《小鸟和牵牛花》教学设计 6页

一年级上册语文素材第五组知识梳理 人教(部编.. 4页

美甲节日营业方案 3页

人才公寓活动举办方案 3页

广场草地婚礼策划方案 2页

美丽乡村小区创建方案 3页

商务会务策划方案 3页

信陵君窃符救赵 34页

落日的幻觉八年级上说课稿 20页

科室水果聚餐方案 2页

1.4.2三角函数的周期性公开课一等奖课件省赛课.. 18页

空调维修合同模板集合6篇 16页

【部编版】小学语文一至六年级语文必背内容整.. 16页

作风建设剖析材料汇编 14页

2024年煤矿安全管理人员安全资格培训考试题库.. 87页

西平李氏分支简介及部分家谱 - 古今族谱 4页

从“交流语言学”角度分析丘吉尔《关于希特勒.. 12页

张欣---神奇的莫比乌斯环教案 3页

2016年四川省委党校在职研究生备考《公共管理.. 20页

医院廉政风险点汇总表. 12页

基于PLC的污水处理系统毕业设计-答辩 18页