1 / 21
文档名称:

11.生存分析与SAS程序.doc

格式:doc   大小:306KB   页数:21页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

11.生存分析与SAS程序.doc

上传人:fy5186fy 2016/9/4 文件大小:306 KB

下载得到文件列表

11.生存分析与SAS程序.doc

文档介绍

文档介绍:第十一章生存分析与 SAS 程序在医学研究中,考察研究因素对研究对象的效应,经典的研究设计方法只观察其所出现的结局或结果。但是在一些诸如癌症等险恶疾病和慢性病的随访研究中,只观察其结局就不够全面,还需要考察研究对象出现某种结局所经历的时间,这段时间称为生存时间( survival time )。生存分析是用来分析生存时间资料的统计方法, 是近几十年来产生且发展甚为迅速的一门应用统计的分支。到目前为止,生存分析已形成一套完整的体系,包括描述生存规律和进行组间比较的参数和非参数方法以及分析影响生存期因素的回归模型等。本章主要介绍描述生存规律的寿命表和乘积限估计法, 用于组间比较的 logrank 检验和作预后因素分析的 Cox 回归模型以及相应的 SAS 过程。 生存分析的基本概念 生存时间在医学研究中,对于肿瘤、心血管等慢性疾病,要考察其治疗方法优劣,疾病预后的好坏以及影响疾病预后的因素,通常采用随访研究的方法。对某一疾病作随访研究时,一般是从某一时间开始, 观察到某一规定时间截止, 而研究对象是始点以后陆续进入观察。随访中要规定一个事件作为随访结局,例如:病人死于研究疾病。如果病人的随访结果是规定的结局,则称为失效或死亡( Failure ), 那么病人从进入观察随访到规定的结局出现, 其间所经历的这段时间称为生存时间或失效时间( Survival time, Failure time, Waiting time ) 。通常用 Ti 表示( i=1,2, …,n,n 为观察个体数)。在随访中,由于客观条件限制,不能也不可能将全部观察对象都观察到规定的结局( Failure ) 。在观察截止时,一组观察对象除了出现规定的结局外,还有三种结果:(1) 死于其他疾病;(2) 由于迁移等原因失去联系( 失访);(3) 随访截止时尚未出现规定的结局。这三种结果虽原因不一,但提供的信息是一致的,这类病人不能获得确切的生存时间,而只知道其生存期比随访观察到的时间长的信息。我们将此类病例数据称为截尾( Censored )数据。其观察到的时间用 C i 表示。在获得生存时间时要注意以下几点: 1. 随访结局可以不是死亡。随访的结局根据研究问题的性质和目的的不同可以是死亡、复发、恢复等。但要明确时间界线。例如:肿瘤病人已作了手术切除治疗,我们随访观察他有否复发,复发就是我们规定的结局。 2. 确定进入随访观察的起点时间。随访研究中,无论是同时进入观察还是陆续进入观察, 对所有对象都要规定某一事件作为进入观察起点事件。例如:病人确诊,治疗开始或手术时间,动物试验中染毒等,作为起点事件要有明确的时间界线。 3. 时间尺度。医学研究一般用日历时间作为时间尺度。但在某些医学问题研究中, 可能不以日历时间作为时间尺度更能反映所研究的问题。例如:对儿童龋齿出现的随访研究中常以儿童出到第几颗牙才出现龋齿作为时间尺度。 .2 生存数据的特征生存数据在结构上有它自己的特点,主要表现为: 1. 生存时间数据的分布与常见的统计数据分布有明显不同, 常呈指数分布、 Weibull 分布、对数正态分布、对数 Logistic 分布、 Gamma 分布或更为复杂的分布,生物医学中的生存时间分布有时呈现不规则状态,因而难以用传统的统计方法对这类数据进行处理。 2. 生存数据中往往包含有截尾数据。在随访研究中,若能观察到研究所规定的结局就能获得确切的生存时间,这类数据称为完全数据。但在实际工作中,由于时间和客观条件限制,部分患者难以观察到终点事件,以致不能获得确切的生存时间,而只能获得进入观察至失访时这段时间。在分析总结时若剔除这部分对象往往导致样本有偏性,并且这部分数据仍然提供了其实际生存时间大于观察到的截尾时间的信息,应充分利用这部分资料的信息。因此,一般随访研究的样本数据中不可避免地包含有截尾数据。 .3 生存时间函数描述生存时间分布规律的函数主要有生存函数、死亡概率函数、概率密度函数和危险率函数。为了后文叙述方便,这里主要介绍生存函数和危险率函数。 1. 生存函数在描述生存规律的数量指标中, 以往常用的指标是某个特定时间的生存率( 例如:3年生存率、 5 年生存率) 。这一指标的主要缺陷为不能反映整个生存规律,一个理想的指标应该是任意时间的生存率, 即生存率是任意时刻 t 的函数。其意义是研究个体生存时间长于t 的概率。若令 T 为生存期, s(t) 为任意时刻 t 的生存率,得 s(t)=p(T ≥ t)0≤ t<∞() 则称 s(t) 为生存率函数,简称生存函数。( Survivor Function )。将 s(t)对t 在直角坐标系作图画出生存率曲线, 可从图上粗略估计出中位生存期或半数生存期。即生存曲线上取