1 / 12
文档名称:

ROC分析方法概要.docx

格式:docx   大小:340KB   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

ROC分析方法概要.docx

上传人:63229029 2017/7/29 文件大小:340 KB

下载得到文件列表

ROC分析方法概要.docx

文档介绍

文档介绍:第二章ROC曲线分析概要
本文先介绍了ROC理论的一些基础知识如特异度和灵敏度等,然后简要介绍了非参数ROC分析方法,并建立了ROC模型。最后介绍了ROC曲线及在R软件中的绘制。
ROC分析的基本要素
ROC分析的基本要素包括真阳性和假阳性也称灵敏度和特异度,以及“金标准”
“金标准”划分被测试者的真实状态为对照组和病例组两类。常见的金标准有跟踪随访、活组织检查、尸体解剖、手术探查等。虽然“金标准”没有必要是十全十美的,但“金标准”应与评价的诊断系统无关,而且比要评价的诊断系统更可靠。“金标准”不够完美时,可用采用Bayesian、模糊金标准、EM估计等方法解决。
对按照“金标准”确定的二分类总体,对照组和病例组分别用阴性和阳性表示诊断试验结果。假定总体样本量是N,诊断试验的可能结果总共有四种:被测试者患病且被正确诊断为患病者,被测试者无病且被错误诊断为患病者,被测试者无病且被正确诊断为无病者,被测试者无病且被错误诊断为患病者。我们可以用一个2×2的列联表来表示它们之间的关系。
诊断结果
“金标准”
合计
患病者
健康者
阳性
a(真阳性)
b(假阳性)
a+b
阴性
c(假阴性)
d(真阴性)
c+d
合计
a+c
b+d
a+b+c+d=N
TPR=aa+c FPR=bb+d
在医学研究中,诊断试验准确度指标最常用的是灵敏度与特异度。
灵敏度(sensitivity),也叫真阳率(true positive rate,即TPR)是被测试者患病且被正确诊断为患病者的样本量在阳性总体中占的比例。灵敏度值越大,假阴率越小。据表2-1 其计算公式是:灵敏度(sensitivity) = 真阳率(TPR) = 1 −假阴率(FNR)= aa+c
标准误为:SETPR=ac/(a+c)3
特异度(specificity),也叫真阴率(true non-positive rate,即TNPR),
是受试者无病且被正确诊断为无病者的样本量占阴性总体的比例。
假阳率(false positive rate,即FPR) = 1−特异度
特异度值越大,假阳率越小。据表2-1 其计算公式是:
特异度(specificity) =真阴率(TNPR) = 1−假阳率(FPR) = db+d
标准误为:SEFPR=bd/(b+d)3
假设二分类总体均服从正态分布, TPR、FPR、TNPR 和FNPR之间的关系可以用图2-1来描述。图中 x = c 为截断点(诊断阈值),α为假阳率(FPR),β为假阴率(FNPR)。
ROC准确性评价指标的优越性
诊断试验的准确性评价指标有正确率、灵敏度和特异度等。它们虽然都可以
反映诊断的准确性,但评价的效果不是很理想。
正确率是被测试者被正确诊断的例数和所占总体的百分数。其计算公式是:
正确百分率=a+dN×100%
标准误是:SE正确百分率=a+d(b+c)/N3
正确百分率的不足之处:
。例如,虽然患病率是5%,如果判定所有样本为健康者,也有可能有95%的正确百分率;
;
,没有唯一性表示,即使有相同的正确百分率的两个总体,也可能有十分不同的假阳性和假阴性。
基于此,单独计算灵敏度和特异度,以弥补正确率的不足,如果两个指标的值越高,诊断评价效果也就越好,其实不然。在对诊断系统做出比较时,如果单独使用灵敏度与特异度,就会存在很大的不足:这两个指标依赖于诊断阈值(或截断点),改变诊断阈值可以增加诊断的灵敏度,但同时也减少了特异度;反之,如果增加诊断的特异度,则需要以减少灵敏度为代价。
另外,有人提出的Youden 指数、阳性似然比、:真阳率与假阳率之比)和阴性似然比等等。
Youden指数是指真阳性率与假阳性率之差,计算公式为:
Youden指数=灵敏度+特异度-1=真阳性率-假阳性率
=TPR-FPR==aa+c -bb+d
其标准误为:SEYouden指数=aca+c3+bdb+d3
阳性似然比(positive likelihood ratio 简写为:LR+)是真阳性率与假阳性率之比,即灵敏度与(1-特异度)的比值,它是ROC曲线某工作点对应的斜率。
阴性似然比(negative likelihood ratio 简写为:LR-)是假阴性率与真阴性率之比,即(1-敏感度)与特异度的比值。
这些诊断指标综合考虑了灵敏度和特异度,但一个指标只对应于一个诊断阈值。当诊断阈值改变时,会得到不同的指标值,给诊断准确度的比较带来不便。所以一般选择阳性似然比或Youden指数最大者为最佳工作点。在评价整个