文档介绍:生存资料共同特点
(jiéjú)和时间两个方面的信息
(jiéjú)为两分类互斥事件
,随访观察往往是从某统一时间点(如确、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止。
,分布类型复杂,不能简单地套用以前的方法
第1页/共42页
第一页,共42页。
生存(shēngcún)分析:既考虑结果又考虑生存(shēngcún)时间的一种统计方法,并可充分利用截尾数据所提供的不完全信息,对生存(shēngcún)时间的分布特征进行描述,对影响生存(shēngcún)时间的主要因素进行分析。
第2页/共42页
第二页,共42页。
生存分析对资料的基本要求
,要有一定的数量,死亡例数和比例不能太少
,即截尾值不宜(bùyí)太多
,为防止偏性常常对被截尾的研究对象的年龄、职业、地区、病情轻重等情况进行分析
4生存时间尽可能精确
第3页/共42页
第三页,共42页。
生存分析的研究内容
研究生存时间的分布特点(tèdiǎn),估计生存率及其标准误。常用方法有乘积极限法和寿命表法
获得生存率及其标准误的估计后,可进行两组或多组生存曲线(生存过程)的比较。常用方法为对数秩检验。
3 生存过程的影响因素分析 常用的分析方法为Cox比例风险回归模型。
第4页/共42页
第四页,共42页。
几个(jǐ ɡè)基本概念
(shìjiàn):又称失效事件(shìjiàn)或终点事件(shìjiàn),指标志某种处理措施失败或失效的特征事件(shìjiàn)。
:广义上指某个起点事件(shìjiàn)开始到某个终点事件(shìjiàn)发生所经历的时间,常用符号t表示。
分布类型不易确定。一般不服从正态分布,少数情况下近似服从指数分布、Weibull分布、Gompertz分布等,多数情况下往往是不服从任何规则的分布类型。
影响因素多而复杂且不易控制。
根据研究对象的结局,生存时间数据可分为两种类型:
完全数据(complete data)
截尾数据(截尾值、删失数据,censored data)
第5页/共42页
第五页,共42页。
几个(jǐ ɡè)基本概念
(1)完全数据:从观察起点到发生死亡事件所经历的时间
(2)截尾(jié wěi)数据:生存时间观察过程的截止不是由于死亡事件,而是由其他原因引起的
主要原因
:指失去联系
:死于非研究因素或非处理因素而退出研究。
:设计时规定的研究时间已到而终止观察,但研究对象仍然存活。
第6页/共42页
第六页,共42页。
几个(jǐ ɡè)基本概念
(sǐwáng)概率 记为q,指在某单位时段开始时存活的个体在该时段内死亡(sǐwáng)的可能性大小。
q=某年内死亡(sǐwáng)数/某年年初观察例数
若年内有截尾,则分母用校正人口数:
校正人口数=年初观察例数-1/2截尾例数
:记为p,与死亡(sǐwáng)概率相对立,表示在单位时间段开始时存活的个体到该时段结束时仍存活的可能性大小。
p=1-q=某年活满一年的人数/某年年初观察例数
第7页/共42页
第七页,共42页。
几个(jǐ ɡè)基本概念
又称累积生存函数,观察对象经历t个时段后仍存活的可能性,记为S(t),0≤ S(t )≤1。如资料中无删失数据,直接法计算生存率的公式为:
S(t)=P(T>t) ------t时刻仍存活的例数/观察总例数 (S(t)为单调下降)。
若含有删失数据,须分时段计算生存概率。假定观察对象在各个时段的生存时间独立,应用概率乘法定理(dìnglǐ)将分时段的生存概率相乘得到生存率。
S(k)=P(T> tk)=p1p2p3……pk
第8页/共42页
第八页,共42页。
几个(jǐ ɡè)基本概念
死亡密度函数:观察对象在某时刻t的瞬时死亡率,又称为死亡概率密度函数。常用(chánɡ yònɡ)f(t)表示:
在实际工作中,他在t时刻的取值可用下式估计
第9页/共42页
第九页,共42页。
几个(jǐ ɡè)基本概念
(hazard function)
定义:指