文档介绍：第二章ROC曲线分析概要本文先介绍了ROC理论得一些基础知识如特异度与灵敏度等,然后简要介绍了非参数ROC分析方法,并建立了ROC模型。最后介绍了ROC曲线及在R软件中得绘制。2、1 ROC分析得基本要素ROC分析得基本要素包括真阳性与假阳性也称灵敏度与特异度,以及“金标准”“金标准”划分被测试者得真实状态为对照组与病例组两类。常见得金标准有跟踪随访、活组织检查、尸体解剖、手术探查等。虽然“金标准”没有必要就是十全十美得,但“金标准”应与评价得诊断系统无关,而且比要评价得诊断系统更可靠。“金标准”不够完美时,可用采用Bayesian、模糊金标准、EM估计等方法解决。对按照“金标准”确定得二分类总体,对照组与病例组分别用阴性与阳性表示诊断试验结果。假定总体样本量就是N,诊断试验得可能结果总共有四种:被测试者患病且被正确诊断为患病者,被测试者无病且被错误诊断为患病者,被测试者无病且被正确诊断为无病者,被测试者无病且被错误诊断为患病者。我们可以用一个2×2得列联表来表示它们之间得关系。诊断结果“金标准”合计患病者健康者阳性a(真阳性)b(假阳性)a+b阴性c(假阴性)d(真阴性)c+d合计a+cb+da+b+c+d=NTPR=aa+cFPR=bb+d在医学研究中,诊断试验准确度指标最常用得就是灵敏度与特异度。灵敏度(sensitivity),也叫真阳率(true positive rate,即TPR)就是被测试者患病且被正确诊断为患病者得样本量在阳性总体中占得比例。灵敏度值越大,假阴率越小。据表2-1其计算公式就是:灵敏度(sensitivity) =真阳率(TPR)=1−假阴率(FNR)=aa+c标准误为:SETPR=ac/(a+c)3特异度(specificity),也叫真阴率(truenon-positive rate,即TNPR),就是受试者无病且被正确诊断为无病者得样本量占阴性总体得比例。假阳率(falsepositiverate,即FPR)= 1−特异度特异度值越大,假阳率越小。据表2-1其计算公式就是:特异度(specificity)=真阴率(TNPR)=1−假阳率(FPR)= db+d标准误为:SEFPR=bd/(b+d)3假设二分类总体均服从正态分布, TPR、FPR、TNPR与FNPR之间得关系可以用图2-1来描述。图中x=c为截断点(诊断阈值),α为假阳率(FPR),β为假阴率(FNPR)。2、2ROC准确性评价指标得优越性诊断试验得准确性评价指标有正确率、灵敏度与特异度等。它们虽然都可以反映诊断得准确性,但评价得效果不就是很理想。正确率就是被测试者被正确诊断得例数与所占总体得百分数。其计算公式就是:正确百分率=a+dN×100%标准误就是:SE正确百分率=a+d(b+c)/N3正确百分率得不足之处:。例如,虽然患病率就是5%,如果判定所有样本为健康者,也有可能有95%得正确百分率;;,没有唯一性表示,即使有相同得正确百分率得两个总体,也可能有十分不同得假阳性与假阴性。基于此,单独计算灵敏度与特异度,以弥补正确率得不足,如果两个指标得值越高,诊断评价效果也就越好,其实不然。在对诊断系统做出比较时,如果单独使用灵敏度与特异度,就会存在很大得不足:这两个指标依赖于诊断阈值(或截断点),改变诊断阈值可以增加诊断得灵敏度,但同时也减少了特异度;反之,如果增加诊断得特异度,则需要以减少灵敏度为代价。另外,有人提出得Youden指数、阳性似然比、:真阳率与假阳率之比)与阴性似然比等等。Youden指数就是指真阳性率与假阳性率之差,计算公式为:Youden指数=灵敏度+特异度-1=真阳性率-假阳性率=TPR-FPR==aa+c-bb+d其标准误为:SEYouden指数=aca+c3+bdb+d3阳性似然比(positivelikelihoodratio简写为:LR+)就是真阳性率与假阳性率之比,即灵敏度与(1-特异度)得比值,它就是ROC曲线某工作点对应得斜率。阴性似然比(negative likelihoodratio 简写为:LR-)就是假阴性率与真阴性率之比,即(1-敏感度)与特异度得比值。这些诊断指标综合考虑了灵敏度与特异度,但一个指标只对应于一个诊断阈值。当诊断阈值改变时,会得到不同得指标值,给诊断准确度得比较带来不便。所以一般选择阳性似然比或Youden指数最大者为最佳工作点。在评价整个诊断方法得准确性时用 ROC 分析,当改变诊断阈值时,可同时获得灵敏度与特异度,也就可以获得 TPR与 FPR 值。ROC曲线就是以FPR 为横坐标与以TPR 为纵坐标绘制而成,并且ROC曲线下得面积大小衡量了诊断系统得判别能力。2、3 RO