文档介绍:基于局部学****半监督多标记分类算法摘要:针对在求解半监督多标记分类问题时通常将其分解成若干个单标记半监督二类分类问题从而导致忽视类别之间内在联系的问题,提出基于局部学****的半监督多标记分类方法。该方法避开了多个单标记半监督二类分类问题的求解,采用"整体法”的研究思路,利用基于图的方法,引入基于样本的局部学****正则项和基于类别的拉普拉斯正则项,构建了问题的正则化框架。实验结果表明,所提算法具有较高的查全率和查准率。关键词:半监督学****多标记分类问题;局部学****标记;正则项中图分类号::ASemi-supervisedmulti-labelclassificationalgorithmbasedonlocallearningLJia*puterandInformationSciences,ChongqingNormalUniversity,Chongqing400047,ChinaAbstT8Ct:Semi-supervisedmulti-posedintoasetofsingle-labelsemi-supervisedbinaryclassificationproblems・However,itresuItsintheignoranceoftheinnerrelationshipbetweenlabels・Asemi-supervisedmulti-labelclassificationalgorithmwaspresented,whichavoidedmultipiesingle-labelsemi-,locallearningregularizerfordatapointsandLaplaceregularizerforlabelswereintroducedandregularizationframeworkoftheproblemwasconstructed・TheexperimentalresultshowstheproposedalgorithmhashigherprecisionandrecalL英文关键词Keywords:semi-supervised learning; multi—labelclassificationproblem;locallearning;label;regularizer0引言多标记学****起源于文本分类研究中遇到的歧义性问题,主要解决一个样本可以同时属于多个类别的问题。现实世界中,多标记学****问题普遍存在[1],例如,在生物信息学中,一个基因序列具有若干个功能,如“新陈代谢”、“蛋白质合成”等;在文本分类中,每篇文档可能同时属于多个主题,如“苹果”、“乔布斯”等;在场景分类中,每个场景图片可能对应于多个类别,如“大海”、“沙滩”等。通常多标记分类问题的一种直观的处理办法是把多标记分类问题转化为一组独立的二类分类问题,其中每一个二类分类问题对应一个标记,每一个样本的标记最终通过组合所有的二类分类问题的结果获得[2]。这种处理方法的好处在于可以利用最新的二类分类算法,缺点是它是孤立地处理分解