1 / 8
文档名称:

ROC曲线及其分析方法综述.pdf

格式:pdf   大小:562KB   页数:8页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

ROC曲线及其分析方法综述.pdf

上传人:三角文案 2021/12/27 文件大小:562 KB

下载得到文件列表

ROC曲线及其分析方法综述.pdf

文档介绍

文档介绍:万方数据
呒捌浞治龇椒ㄗ凼二分类问题的命中率及误报率之间的权衡关裂4撕螅梅椒王彦光,朱鸿斌,徐维超猚叩幕拘灾剩樯芰薘曲线的一些常见广东工业大学学报含参数法及非参数法。其中,非参数法因其简单、灵活的特性,在实际应用中得到比较广泛的应用。针对二分类问题,接收机工作特性曲线琑治銎鹪从诙绞逼诘男藕偶觳夥法,最早被应用于处理雷达图像,用来描述检测信号广泛应用于医疗诊断口‘俊T辏琒引入机器学****领域,用于评价分类器性能【。从此,咴诨餮皀】、计算机视觉‘。等领域被用于算法的评价和优化方面。吣芏苑掷嗥鞯淖既沸越腥ň中缘钠估,它包含了所有可能的决策阈值,不需特定的决策阈值。此外,卟灰览涤诓馐越峁墓婺#对分类结果进行单调变换可以保持不变性¨。由此,在大多数实际问题中,样本分布不均匀和错误分类的代价不一致的问题可能会影响评估结果,而曲线能够很好解决该难题。在性能诊断方面,线是完全意义上的自由分布假设【,无需用到假设类分布的参数形式,从而保证了哂τ玫墓泛性。根据咴谀P陀胨惴ǖ钠兰邸⒄故尽⒈较、选择和优化中所体现的优异性”,本文旨在从二分类问题引入叩幕靖拍睿樯芰朔遣问参数、半参数模型和叩墓菇ǚ椒ǎ备评价方法,为读者的实践应用提供参考。定义二分类方法在多种实际应用决策中起着核心作用。例如,在模式识别领域,重要的数据应该在一个巨大的数据集中进行分类和标记【】;在基于历史数据的预测中,将每个数据区分为是否遵循历史趋势的二分类方法:在人体跟踪领域,要分析人体行为,需要将阳性样本从阴性样本中分离出来,完成跟踪步骤。总而言之,二分类贯穿于社会生产和生活通信作者:徐维超校淌冢┦浚┦可际Γ饕Q芯糠较蛭M臣菩藕糯恚珽篧甧册第卷第年愣üひ荡笱ё远г海愣ü阒摘要:接收机工作特性曲线分析可用于评价分类器的性能以及寻找不同类别的最优分割点等问题,其构建方法主要包详细介绍如何通过接收机工作特性曲线非参数法对分类数据进行接收机工作特性曲线构建和评价。关键词:二分类;接收机工作特性曲线;非参数法;打线评价中图分类号:;文献标志码:文章编号:,瓾收稿日期:.—基金项目:国家自然科学基金资助项目;广州市科技计划项目作者简介:王彦光校┦垦芯可饕Q芯糠较蛭M臣菩藕糯恚珽..猤,·琗:.,猵.篵;籲;./.,
万方数据
而衍鳳鯰丽SΓ琔,其中一是来自摊特征空间的数据点,对假设大小为蠡的训练样本集彳,《,于Α室患浅#瑇謢,该数据集由隼啾的各个领域,也是数据处理领域的热门研究内容。二分类是一种基于樵K氐姆掷喙嬖虻娜务暇】,在模型构建过程中,二分类算法能发现属性值与目标值之间的关系。不同的分类算法将使通过将一组测试数据中的预测值与己知目标值进行比较,从而对分类模型掷嗥进行检验。一个二分类模型的定义及构建过程如下。组成,其对应的二分类标记空间为蹋篺,盛鬺,若记厶。,则蕾属于第一类;若记厶蚰于第二类。对于一个二分类器,对于输入数据,二分类问题可以理解为对数据集空间一对应标记的上述分类器是分类算法在训练集上不断训练,最终生成对数据集类别的预测艺,分类器预测的分类结果和真实分类一致性越强,说明分类器性能越好。平衡性¨。数据平衡性是指不同类别数据集数量是否平衡,比如一个有鍪莸亩掷嗍菁最大化总体分类精度,这将导致在不平衡的场景中,只需将所有实例预测为数据较多的类别即可获得较高的精度。因此,不平衡的数据集将会降低分类器的评判指标