文档介绍:会计学
*
统计学logistic回归(huíguī)分析
第一页,共60页。
问题(wèntí)提出:
医学研究中常研究某因素存在(cúnzài)条件下某结果是否发生?以及之间的关系如何?
因素(X) 疾病结果(Y)
x1,x2,x3…XK 发生 Y=1
不发生 Y=0
例:暴露因素 冠心病结果
高血压史(x1):有 或无 有 或 无
高血脂史(x2): 有 或 无
吸烟(x3): 有或无
第1页/共59页
第二页,共60页。
研究问题可否用多元(duō yuán)线性回归方法?
Y 的取值为计量的连续性随机变量(suí jī biàn liànɡ)。
。
不能回答“发生与否”
logistic回归方法补充多元线性回归的不足
第2页/共59页
第三页,共60页。
Logistic回归(huíguī)方法
该法研究是
当 y 取某值(如y=1)发生的概率(p)与某暴露因素(x)的关系。
P(概率)的取值波动0~1范围。
基本原理:用一组观察数据(shùjù)拟合Logistic模型,揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系。
第3页/共59页
第四页,共60页。
一、基本概念
logistic回归要求应变量(Y)取值为分类变量(两分类或多个分类)
自变量(Xi)称为(chēnɡ wéi)危险因素或暴露因素,可为连续变量、等级变量、分类变量。
可有m个自变量X1, X2,… Xm
第4页/共59页
第五页,共60页。
(móxíng)方程
一个自变量与Y关系的回归模型(móxíng)
如:y:发生=1,未发生=0 x 有=1无=0,
记为p(y=1/x)表示某暴露因素状态下,结果y=1的概率(P)模型(móxíng)。
或
模型描述(miáo shù)了应变量p与x的关系
第5页/共59页
第六页,共60页。
P概率(gàilǜ)
1
Z值
0
1
2
3
-1
-2
-3
图16-1 Logistic回归(huíguī)函数的几何图形
Β为正值,x越大,结果(jiē guǒ)y=1发生的可能性(p)越大。
第6页/共59页
第七页,共60页。
几个(jǐ ɡè)logistic回归模型方程
第7页/共59页
第八页,共60页。
logistic回归(huíguī)模型方程的线性表达
对logistic回归模型的概率(gàilǜ)(p)做logit变换,
截距(常数(chángshù))
回归系数
Y~(-∞至+∞)
线性关系
方程如下:
第8页/共59页
第九页,共60页。
在有多个(duō ɡè)危险因素(Xi)时
多个变量(biànliàng)的logistic回归模型方程的线性表达:
或
第9页/共59页
第十页,共60页。