文档介绍:中医科研设计与统计
湖北中医学院基础部卫生生物教研室(J-C204)
Tel:027-68890135
E-Mail:annworld@
《医学统计学》马斌荣主编
人民卫生出版社 2006年第四版
中医科研设计与统计
1
湖北中医学院卫生教研室
在上一节中我们通过直线相关分析知道了待产妇尿中雌三醇含量和新生儿体重之间成正相关关系。
那么,如果我们知道了一位待产妇的尿雌三醇含量,能推断出这个新生儿的体重吗?或者这个新生儿的体重可能在什么范围内呢?
对此相关分析不能给我们答案,这些问题需要使用直线回归的方法来解决。
中医科研设计与统计
2
湖北中医学院卫生教研室
第二节线性回归
当我们知道了两个变量之间有直线相关关系,并且一个变量的变化会引起另一个变量的变化,这时,如果它们之间存在准确、严格的关系,那么它们的变化可用函数方程来表示。
在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来反映。
但是,我们需要利用数学函数的理论去研究两变量之间的数量依存关系,为了区别于数学上确定的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归。
中医科研设计与统计
3
湖北中医学院卫生教研室
直线回归的统计模型
;
:截距(intercept),是x=0时y的本底水平;
:y的变化中随x变化而变化的部分;
β称为回归系数(regression coefficient):自变量x每改变一个度量单位,应变量y改变量的平均估计值;
:又称残差(residual);
是不能由变量x所解释的变异部分;
反映了除变量x之外的随机因素对y的影响。
中医科研设计与统计
4
湖北中医学院卫生教研室
建立直线回归方程
利用样本数据计算参数α和β的估计值a和b,建立模型的估计方程,即寻找一条与所有散点都最为接近(实测点到直线的纵向距离)的直线,使得总的预测误差最小。
中医科研设计与统计
5
湖北中医学院卫生教研室
寻找总的预测误差最小的直线
X
观测值
预测值
预测误差(残差)
Y
中医科研设计与统计
6
湖北中医学院卫生教研室
最小二乘法(least square method)
怎样的最好的代表了所有的y,需要有个标准。经典的标准是最小二乘(least squares)原则:每个观察点距离回归线的纵向距离的平方和最小,即残差平方和最小:
因为直线一定经过“样本均数”点
中医科研设计与统计
7
湖北中医学院卫生教研室
计算例1资料的估计值a和b
中医科研设计与统计
8
湖北中医学院卫生教研室
将估计值a和b代入方程
回归参数a、b的解释
(b):
当x每增加1个单位时,y平均改变b个单位;
本例b=,表明待产妇尿中雌三醇含量每增加1mg/24h,。
(a):
当x=0时y本底水平的平均估计值;
本例a=,表示待产妇尿中雌三醇含量为0时,(注意这种解释有时候并无实际意义,如x是否可取0)。
中医科研设计与统计
9
湖北中医学院卫生教研室
问题:直线回归方程的建立是否一定能说明雌三醇含量与新生儿体重之间存在回归关系?
与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得(即检验总体回归系数β是否为0)。
中医科研设计与统计
10
湖北中医学院卫生教研室