1 / 12
文档名称:

计算机应用技术SAS-7logist-8K-9latin.pdf

格式:pdf   页数:12
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

计算机应用技术SAS-7logist-8K-9latin.pdf

上传人:中国课件站 2011/12/7 文件大小:0 KB

下载得到文件列表

计算机应用技术SAS-7logist-8K-9latin.pdf

文档介绍

文档介绍:第7章逻辑斯蒂(Logistic
regression)回归分析
科学研究中,经常遇到因变量为二值ƒ 例1 在女生月经初潮调查中,23名11-15岁
(二项)分类资料,如疾病的发生与不发女生的月经与体质情况如表。其中,x1是30
生、有或没有等。同时,可以有数个自变量秒脉搏数,x2是体重,x3是年龄,月经Y是
对因变量产生影响。这时可以用逻辑斯蒂回二项分类变量,0表示未来月经,1表示已来
归分析(Logistic regression)。月经。试用Logistic 回归分析脉搏、体重和年
龄与月经来潮的关系。
1 2
女生月经与体质情况
123⋯1213⋯ 23 ƒ
x1 39 42 40 45 51 45
x2 34 30 35 39 37 44 ƒ
x3 11 11 11 11 12 15
Y 000 11 1 ƒ Submit 得到结果。
3 4
模型有显著性意义
5 6
1
ƒ 由最大似然估计法得到对数优势线性判别函
数:
ƒ Logit P =--+
(月经未来潮概率。根据依变量取值排序,先“0”后“1”,针对未
来月经(Y=0) )
ƒ Logit P =-++-
(月经来潮概率。根据依变量取值排序,先“1”后“0”,针对已来
月经(Y=1) )
7 8
ƒ title 'The Logistic Regression'; ƒ title 'The Logistic Regression';
ƒ data logist1; ƒ data logist1;
ƒ input x1 x2 x3 y@@; ƒ input x1 x2 x3 y@@;
ƒ cards; ƒ cards;
ƒ 39 34 11 0 42 30 11 0 ƒ 39 34 11 1 42 30 11 1
ƒ 40 35 11 0 48 38 12 0 ƒ 40 35 11 1 48 38 12 1
ƒ 42 29 12 0 39 33 13 0 ƒ 42 29 12 1 39 33 13 1
ƒ 38 32 13 0 45 37 13 0 ƒ 38 32 13 1 45 37 13 1
ƒ 35 35 13 0 36 29 13 0 ƒ 35 35 13 1 36 29 13 1
ƒ 38 33 14 0 45 39 11 1 ƒ 38 33 14 1 45 39 11 0
ƒ 51 37 12 1 42 37 12 1 ƒ 51 37 12 0 42 37 12 0
ƒ 42 55 12 1 43 49 12 1 ƒ 42 55 12 0 43 49 12 0
ƒ 45 36 12 1 40 44 13 1 ƒ 45 36 12 0 40 44 13 0
ƒ 41 40 13 1 39 48 13 1 ƒ 41 40 13 0 39 48 13 0
ƒ 45 41 13 1 46 43 14 1 ƒ 45 41 13 0 46 43 14 0
ƒ 45 44 15 1 ƒ 45 44 15 0
ƒ ; ƒ ;
ƒ proc logistic; ƒ proc logistic;
ƒ model y=x1 x2 x3; ƒ model y=x1 x2 x3;
ƒ run; ƒ run;
9 10
ƒ 例1:已知女生甲的X1=40, X2=40, X3=13;已知
女生乙的X1=39, X2=35, X3=11。判别月经来潮
的概率。
exp-++-
p =
1+ exp-++-
,
判别:女生甲已来月经(P>),女生乙未来月经(P<)
11 12
2
ƒ 例2 50例急性淋巴细胞性白血病病人,治疗ƒ 非编程方法:
时取得了外周血中细胞数X1(千个/mm3)、
巴结浸润等级分为、、、四级,出
X2( 0 1 2 3 ) Submit 生成SAS数据集:
院后巩固治疗X3(有巩固治疗为1,无巩固
治疗为0),并随访取得病人的生存时间 Assist data analysis regression
T(月),变量Y(生存时间1