1 / 2
文档名称:

在Excel中作ROC曲线.pdf

格式:pdf   大小:132KB   页数:2页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

在Excel中作ROC曲线.pdf

上传人:3144187108 2022/7/27 文件大小:132 KB

下载得到文件列表

在Excel中作ROC曲线.pdf

文档介绍

文档介绍:在 Excel 中作 ROC 曲线

分类模型尝试将各个实例(instance)划归到某个特定的类,而分类模型的结果一般是实数值,
如逻辑回归,其结果是从 0 到 1 的实数值。这里就涉 Negative(FP+TN)
合 Predicted Predicted
TP+FP+FN+TN
计 Positive(TP+FP) Negative(FN+TN)
从列联表引入两个新名词。其一是真正类率(true positive rate ,TPR), 计算公式为 TPR=TP /
(TP + FN),刻画的是分类器所识别出的正实例占所有正实例的比例。另外一个是负正类率
(false positive rate, FPR),计算公式为 FPR= FP / (FP + TN),计算的是分类器错认为正类
的负实例占所有负实例的比例。还有一个真负类率(True Negative Rate,TNR),也称为
specificity,计算公式为 TNR=TN / (FP + TN) = 1 − FPR。
在一个二分类模型中,对于所得到的连续结果,假设已确定一个阀值,比如说 ,大于这个值
的实例划归为正类,小于这个值则划到负类中。如果减小阀值,减到 ,固然能识别出更多的
正类,也就是提高了识别出的正例占所有正例的比类,即 TPR,但同时也将更多的负实例当作了
正实例,即提高了 FPR。为了形象化这一变化,在此引入 ROC。
Receiver Operating Characteristic,翻译为"接受者操作特性曲线",够拗口的。曲线是由两
个变量的组合,1-specificity 和 Sensitivity. 由于 1-specificity=FPR,即负正类率。
Sensitivity 即是真正类率,True positive rate,反映了正类覆盖程度。这个组合以
1-specificity 对 sensitivity,即是以代价(costs)对收益(benefits)。
下表是一个逻辑回归得到的结果。将得到的实数值按大到小划分成 10 个个数相同的部分。
Percentile 实例数 正例数 1-特异度(%) 敏感度(%)
10 6180 4879