1 / 8
文档名称:

基于改进的半监督聚类的不平衡分类算法.pdf

格式:pdf   大小:533KB   页数:8页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于改进的半监督聚类的不平衡分类算法.pdf

上传人:元春文档 2022/2/26 文件大小:533 KB

下载得到文件列表

基于改进的半监督聚类的不平衡分类算法.pdf

相关文档

文档介绍

文档介绍:计算机应用
Journal of Computer Applications
ISSN 1001-9081,CN 51-1307/TP
陆 宇,赵凌云,白斌雯,姜 震*
(江苏大学 计算机科学与通信工程学院,江苏 镇江 212013)
(*通信作者电子邮箱:******@ )
摘 要: 不平衡分类的相关算法作为机器学习领域的研究热点之一,其中过采样通过重复抽取或者人工合成来增加少数类
样本,以实现数据集的再平衡。但是当前的过采样大部分是基于原有的样本分布进行,难以揭示更多的数据集分布特征。为
了解决以上问题,首先,提出一种改进的半监督聚类算法来挖掘数据的分布特征;其次,基于半监督聚类的结果,在属于少
数类的簇中选择置信度高的无标签数据(伪标签样本)加入原始训练集。除了实现数据集的再平衡外,还可以利用半监督聚
类获得的分布特征来辅助分类模型的训练;最后,融合半监督聚类和分类的结果来预测最终的类别标签,进一步提高算法的
不平衡分类性能。选择 G-mean 和曲线下面积(AUC)作为评价指标,将所提算法与 TU、CDSMOTE 等 7 个基于采样的不平
衡分类算法在 10 个公开数据集进行了对比分析。实验结果表明,与 TU、CDSMOTE 等先进的不平衡分类方法相比,所提算
法在 AUC 指标上分别提高了 %和 %,在 G-mean 指标上分别提高了 %和 %,在两个评价指标上都取得了最高的平
均结果,所提算法能够有效提高学衡分类性能。
关键词: 不平衡分类;半监督聚类;伪标签样本;过采样;融合
中图分类号:TP181 文献标志码: A
Imbalanced classification algorithm based on improved
semi-supervised clustering
LU Yu, ZHAO Lingyun, BAI Binwen, JIANG Zhen*

最近更新

2025年马原考试题库含答案(综合题) 93页

2025年马原考试题库含答案【能力提升】 95页

2025年马原考试题库附答案(培优b卷) 95页

基于“高分四号”卫星影像洞庭湖湿地信息提取.. 6页

交管12123学法减分复习题库【真题汇编】 45页

基于CAS理论的IT外包决策过程研究 5页

交管12123学法减分复习题库含答案【培优a卷】.. 45页

2025年马原考试题库附答案(综合题) 93页

2025年对外汉语教学优秀教案快乐汉语 3页

交管12123学法减分复习题库(基础题) 45页

县乡教师选调考试《教师职业道德》题库及参考.. 45页

县乡教师选调考试《教师职业道德》题库及答案.. 45页

县乡教师选调考试《教师职业道德》题库及参考.. 45页

县乡教师选调考试《教师职业道德》题库含答案.. 46页

监理工程师之水利工程目标控制题库(巩固) 166页

商务接待实习报告 5页

咖啡店商业计划书2 30页

各年龄段幼儿游戏的特点《幼儿游戏与指导》 5页

华住酒店前台员工考试试题 5页

医学论文撰写的格式要求 4页

制造业企业战略成本管理应用研究[文献综述] 5页

农林经济管理专业本科毕业论文选题 4页

公路工程投标报价方法及技巧 3页

公司治理和内部控制的文献综述(一) 5页

公共部门人力资源管理名词解释。 5页

元旦节文艺汇演晚会主持词 5页

信托研究报告-信托项目商业计划书(2025年) 5页

供应链风险管理报告(工作汇报模板) 5页

体育议论文素材(共7) 6页

西南地区肝衰竭病因构成及其与预后的关系 3页