文档介绍:SPSS软件在医学科研中的应用
何平平
北大医学部流行病与卫生统计学系
Tel:82801619
线性相关与回归
内容:
多重线性回归分析
简单线性相关与回归
Spearman等级相关
特例
(一)直线回归(linear regression)
:用直线方程表达X(自变量,independent variable;解释变量,explanatory variable;预测变量,predictor variable )和Y (因变量,dependent variable;响应变量,response variable;结局变量,e variable )之间的数量关系。
一、简单线性相关与回归
a:是回归直线在Y轴上的截距,即X=0时Y的预测值。
b:是回归直线的斜率,又称为回归系数。
表示当X改变一个单位时,Y的预测值平均改变|b|个单位。
最小二乘方法(the method of least squares):各实测点到直线的纵向距离的平方和最小。
: b为样本回归系数,由于抽样误差,实际工作中b一般都不为0。要判断直线回归方程是否成立,需要检验总体回归系数是否为0。
只有当0时,才能认为直线回归方程成立(具有统计学意义)。
H0:=0 H1:0
方法一:t检验
方法二:F检验
两种方法等价,
(1)总体回归系数的95%置信区间估计
(2) Y的均数的95%置信区间估计
当X=X0时,以95%的概率估计Y的均数的置信区间为
(3)个体Y值的95%容许区间估计
当X=X0时,以95%的概率估计个体Y值的波动范围为
描述具有直线关系的两个变量之间的相互关系。
(二)直线相关(linear correlation)
r:相关系数,correlation coefficient
用来衡量有直线关系的两个变量之间相关的密切程度和方向。-1r1
r>0,正相关;r=1为完全正相关
r <0,负相关;r=-1为完全负相关
|r|越大,两变量相关越密切(前提:r有统计学意义)