文档介绍:流行病学研究中的偏倚及其控制
1、选择偏倚
2、信息偏倚
3、混杂偏倚
误差(error)
(1)随机误差(抽样误差;random error):是因抽样产生的样本统计量与总体参数之间的差异。即标准误(standard error,SE)
抽样误差与样本含量的关系:
式中:N 为样本含量
为抽样误差(标准误)
为总体各变量值变异程度
(2)系统误差(偏倚;systematic error;bias):由某些不能准确定量但恒定的因素造成的,使调查结果偏离总体真值的误差。
来源:1)受试者:抽样不随机;受试者本身变异
2)观察者:倾向性暗示;个人技术偏差
3)仪器、试剂:仪器未校正,使用不当,发生故障;
试剂未标准化;
4)非试验性外环境因素:气象;照明;震动;声响
第一节选择偏倚(select bias)
一、定义:选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。
二、种类
(一)入院率偏倚(Berkson):以医院病人为研究对象时,由于入院率的不同而造成的偏差。例:
表10-1 因不同住院率而住院的A、B患者及其与因素X的关系
造成不同疾病入院率不同的原因:医院技术特长;患者疾病严重程度、经济状况、就诊方便程度等(医院、病人双向选择)。
疾病暴露于X者非暴露于X者合计 X暴露率(%) OR P
实际人群
A(对照) 200 800 1000 20 1 1
B(病例) 200 800 1000 20
合计 400 1600 2000 20
住院率(对照A=50%;病例B=20%;暴露于因素X者40%)
A(对照) 140 400 540 <
B(病例) 104 160 264
合计 244 560 804
200×+100 ×
800 ×
200×+160 ×
800 ×
(二)现患病例-新发病例偏倚(Neyman bias):病例对照或现况研究中的的病例为现患典型病例,不包括死亡、病程短、轻型等病例。因此,存活旧病例的信息可能只与存活有关,未必与发病有关,从而高估了暴露因素的作用;或病例因疾病改变了生活习惯,从而过低估了暴露因素的作用。队列研究和实验流行病学研究所用的是新病例,无此偏倚。
例:Framingham心血管疾病研究:
队列研究:高胆固醇者患冠心病OR值=(有显著差异)
病例对照研究:高胆固醇者患冠心病OR值=(无显著差异)
原因:患冠心病者诊断后戒烟、体育锻炼、注意饮食
(三)检出征候偏倚(暴露偏倚;detection signal bias;unmasking bias):某因素本与疾病与致病无关,但可引起所研究疾病的症状或体征,从而促使患者早就诊,提高了早期病例检出率,过高的估计了暴露程度。
例:病例对照研究发现:服用雌激素与子宫内膜癌发病有正关联。
原因:雌激素促进子宫内膜生长,导致出血,频繁接受检查,促使早期发现子宫内膜癌患者。
(四)易感性偏倚(susceptibility bias):某些因素可直接或间接低影响研究对象对所研究疾病的易感性,导致所研究的因素与疾病出现虚假关联。
例:健康工人效应。
(五)排除偏倚(exclusive bias):由于未严格按对等原则或标准选择研究对象,而是自观察组或对照组中排除某些研究对象,从而造成因素与疾病之间的虚假联系。
例:服用阿司匹林与心肌梗死关系的病例对照研究,应排除慢性关节炎和慢性胃溃疡患者(前者易服此药,后者易不服此药)。如果此类患者不排除,且在两组分布不均匀,易引起偏倚。
(六)无应答偏倚(non-respondent bias):研究对象未按要求回答调查内容,而无应答者的患病或因素的暴露情况与应答者又不同,从而造成该偏倚。
例:Seltzer等(1974)以函访调查人群吸烟状况,非吸烟者应答率为85%,吸烟者为67%。其它研究发现非应答者各种不利于健康因素的暴露率高于应答者。
原因:身体状况;对健康关心程度;调查内容;年龄;文化
二、测量:比较总人群(总体)和研究人群(样本)所研究疾病与因素的分布。
总体选择概率
暴露非暴露暴露非暴露
病例病例
对照非病例
总人群OR=AD/BC 样本OR0=A0D0/B0C0 据选择概率 OR0=OR(ad/bg)
则:选择偏倚=(OR0-OR)/OR= (ad/bg)-1 若=0 ,无选择偏倚 OR0=OR
若>0 ,有选择偏倚 OR0>OR
上例选择概率: 若<0 ,有选择偏倚 OR0<OR
B病+暴露:a=104/200= B病+未暴露: b=160/800=
A病+暴露:g=140