1 / 49
文档名称:

逻辑斯蒂回归.ppt

格式:ppt   大小:1,413KB   页数:49页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

逻辑斯蒂回归.ppt

上传人:sxlw2016 2022/3/9 文件大小:1.38 MB

下载得到文件列表

逻辑斯蒂回归.ppt

相关文档

文档介绍

文档介绍:定性数据的建模
列联表及列联表分析
Logistic回归基本理论和方法
Logistic回归步骤以及SPSS实现
1
2
3
1
列联表及列联表分析
研究两个属性变量之间是否有联系
研究步骤:
 通过问卷调查或统计 
优势比
20
概率p的预测
P与多因素之间的关系预测
21
P与单因素之间的关系图
p
x
1
最可能成功范围
最不可能成功范围
22
回归系数的含义
优势比(Odds Ratio)—事件发生与不发生的概率比
优势比与单变量系数之间的关系
23
Logistic回归系数的估计(分组数据)
n组观测数据结构:
序号
x
参加调查
总数
事件出现
次数
事件出现
频率
Logistic 变换
1
2
n
i
24
拟合模型

其中 近似服从
权(weight)
回归模型具有异方差性
25
转换成经典回归模型(加权最小二乘)
其中 近似服从
26
例题
在一次住房展销会上,与房地产商签订初步购房意向书的共有n=, x(万元)为自变量,建立Logistic回归模型.
27
28
29
点击
30
利用上式可以对购房比例进行预测,如
31
Logistic回归系数的估计(未分组数据)
n组观测数据:
~
与 的关系
32
参数的极大似然估计
的分布函数
的似然函数
未分组数据结构
33
似然函数的对数表达
利用迭代法求解似然函数对数的最大值点就是参数的极大似然估计,记为:
34
拟合的优良性
回归模型的优良性
拟合优度
回归系数的显著性
-2log(L)
Wald=

 goodness-of-fit statistics
35
Hosmer-Lemeshow Test
零假设:
因变量实际分布与预测的分布无差异
决策准则:
拒绝零假设 模型不显著
36
Logistic回归步骤以及SPSS实现
37
38
不显著,去掉最不显著的月收入变量,重新估计
39
40
结论:女性乘公交车比例高于男性,年龄越大,乘车的比例越高。
41
科研教案
庞素林. Logistic回归模型在信用风险中的应用. 数学的实践与认识. 2006,36(9):129~137
42
判别模型建立的基本步骤
样本分组
将样本分成训练样本组和测试样本组
建模过程
利用训练样本建立分类模型
评价过程
利用测试样本评价模型的精度
第二步
第三步
第一步
43
摘要
通过运行SPSS, 建立Logistic 回归信用评价模型(credit evaluation model) , 用来对中国2000年106家上市公司进行两类模式分类, 这两类模式是指按照公司的经营状况分为“差”和“正常”两个小组. 对每一家上市公司, 考虑其经营状况的4 个主要财务指标: 每股收益、每股净资产、净资产收益率和每股现金流量.
44
仿真结果表明,Logistic 回归信用评价模型对总体106 个样本, 判别准确率达到99. 06%. 此外, 本文的研究结果还发现, 当利用SPSS 的Discriminant 给出的模型系数建立的线性判别分析模型和利用SPSS 的Multinomial Logistic 给出的模型参数建立的Logistic 回归模型, Logistic 回归模型的判别结果不如线性判别模型. 但如果剔除不合格的样本, 或是将样本数据规格化, 则可以提高Logistic 回归模型的分类准确率.
45
引言中提及的一些研究结果
Martin(1977)用Logistic模型预测公司破产及违约的概率
Ohlson(1980)将Logistic模型应用于信用风险分析
Madalla(1983)采用Logistic模型区别违约与非违约贷款申请人
46
David West(2000)利用5种神经网络和5种统计分类模型(线性判别分析、Logistic回归分析、K最近邻法、核密度分类法、分类树法)分别对德国和澳大利亚两组财务数据进行两类模式分类,研究结果表明: Logistic模型的判别准确率最高,%%.
47
一个一般结论
数据满足正态分布
Logistic 回归模型与判别分