文档介绍:重复测量资料的统计分析方法
在临床医学研究中,一些干预研究和纵向研究都经常会涉及到同一研究对象的多次观察,而同一个对象的多次观察的记录资料称为重复测量的资料。由于同一对象不同时间点的观察往往存在相关的问题,也就是存在不独立性的问题,而大多数的医学统计方法都要求资料是独立,所以这些资料的统计分析需要比较特殊的统计方法进行分析。本节将先举例介绍常见的重复测量资料,并介绍相应的重复测量资料的统计分析方法。
单个样本的重复测量资料
例1 为了考察某药物减肥的作用,现考察5个身高为160cm、服用该药的女性肥胖者,疗程为3个月,这5名女性肥胖者在服用该药前后的体重测量值(kg)如下:
肥胖者编号
1
2
3
4
5
服药前体重Y0i
50
52
49
55
46
服药后体重Y1i
48
51
49
52
45
这是一组观察对象的资料,每个观察对象有两个时间点的测量资料,因此这是最简单的重复观察测量资料(也可以认为配对设计的资料)。
由于各个观察对象在服药前的体重不全相同,所以其体重含有服药前的体重个体变异成分,而在服药后,各个观察对象的体重下降幅度也不全相同,故存在体重下降幅度的个体变异成分,因此观察对象在服药后的体重中不仅含有体重下降幅度的个体变异成分,而且还含有服药前的体重个体变异成分,故服药前后的体重资料不独立。对于这种不独立资料的统计分析一般采用变异成分的分解或消除某一个体变异成分的方法进行统计处理的。如配对t检验和符号秩检验就是采用服药前后资料相减作为统计分析数据,因而消除了服药前体重的个体变异,使进入统计分析的资料仅含有体重下降幅度的个体变异,但这种消除某种不独立的变异成分的统计方法无法对比较复杂的重复测量资料进行统计分析。因而本节将借助统计软件Stata,介绍应用混合模型(Mixed Model)对重复测量资料进行统计分析。
设观察对象体重的总体均数为m0,服药后体重总体均数为m1,即服药前后的体重改变量的总体均数为b=m1-m0。若b=0说明服药前后的体重平均变化为0,即无疗效;若b<0,说明服药后的人群平均体重低于服药前的平均体重,即该药物减肥是有效的;若b>0,说明服药后的平均体重高于服药前的平均体重,即该药对减肥有不利的作用。针对本例服药前后的体重总体均数的变化关系,引入自变量t,建立下列服药前后的体重总体均数表达式(即混合模型的确定性部分表达式)。
(12-1)
t=0时,m为服药前的体重总体均数m0;t=1时,m为服药后的体重总体均数
m1。应用混合模型可以对本例资料进行统计分析,其中b和m0的参数估计一般采用限制的最大似然法,然而计算相当复杂,故我们将借助Stata软件对上述资料用混合模型进行统计分析,相应的Stata软件的数据格式如下。
t
y
no
0
50
1
0
52
2
0
49
3
0
55
4
0
46
5
1
48
1
1
51
2
1
49
3
1
52
4
1
45
5
其中y为体重测量值,t为服药时间的自变量,no为观察对象的编号,相应的Stata操作命令如下:
Random-effects GLS regression Number of obs = 10
Group variable (i) : no Number of groups = 5
R-sq: within = Obs per group: min = 2
between = . avg =
overall = max = 2
Random effects u_i ~ Gaussian Wald chi2(1) =
corr(u_i, X) = 0 (assumed) Prob > chi2 =
------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
t | - .509902 - - -.4006105
_cons |
-------------+-----------------------------------------