1 / 59
文档名称:

基于偏最小二乘回归的多标签分类算法研究.pdf

格式:pdf   页数:59页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于偏最小二乘回归的多标签分类算法研究.pdf

上传人:gd433 2016/7/18 文件大小:0 KB

下载得到文件列表

基于偏最小二乘回归的多标签分类算法研究.pdf

相关文档

文档介绍

文档介绍:基于偏最,j、--乘回归的多标签分类算法研究摘要当今社会,随着计算机硬件和软件技术的快速发展,不断涌现出大量功能强大且价格合理的数据存储介质。数据存储能力的极大提升推动了数据库技术的快速发展。大量的数据库系统被用来管理大容量存储介质上的海量数据。但由于缺乏有效的管理工具,隐藏在这些海量数据背后的有用知识却不能被人们所发现和利用。为了有效地将这些知识用于科学研究、欺诈检测、生产管理、市场分析、工程规划等领域,从海量数据中发现这些知识的工具——数据挖掘技术得到了蓬勃的兴起和发展。分类是数据挖掘中进行数据分析的一个重要研究方向。它从预先定义的数据类中得出一个分类模型来预测未分类的数据。在传统的分类中,每个样本仅有一个标签,它们属于单标签分类。然而在许多实际应用中,每个样本同时拥有几个不同的标签,这些属于多标签分类。近年来,由于多标签数据的普遍存在和广泛的应用价值,越来越多的研究者对其产生了浓厚的兴趣。随着多标签分类问题研究的不断深入,人们将各种不同的学****方法应用到多标签分类问题中,提出了大量的多标签分类学****算法,解决了实际应用中的很多不同问题。例如,在多元统计分析中,典型相关分析是研究两组多维变量之间相互关系的一种技术,它已经成功地应用到多标签分类问题中。同样地,在多元统计分析中,偏最小二乘回归具有多元线性回归和主成分分析的优点,它也能够通过一组多维变量预测另一组多维变量。偏最小二乘回归通过最小二乘回归拓展而来,在化学领域得到了最初的应用。近年来,偏最小二乘回归在经济、水利、环保和电力等领域都得到了广泛的应用,并取得了良好的效果。在分类问题中,偏最小二乘回归作为降维方法与其它方法相结合进行过分类,也直接作过单标签分类方法。但偏最小二乘回归还未直接应用于多标签分类问题中。本文研究基于偏最小二乘回归的多标签分类问题,主要研究内容包括: (1)Eh于偏最小二乘回归能够将两组多维变量相关联,并能通过一组多维自变量预测另一组多维因变量,因而将偏最小二乘回归方法与多标签分类相结合, 提出基于偏最小二乘回归的多标签分类算法。首先,基于非线性迭代偏最小二乘算法构建偏最小二乘回归模型;然后,根据多标签分类的特点,将训练集中的训练数据通过偏最小二乘回归得到一个多标签分类模型,再通过这个多标签分类模型对测试集中的测试数据进行多标签分类。(2)将基于偏最小二乘回归的多标签分类算法在现实中的多标签数据集上进行仿真实验。在实验的过程中,将该多标签分类算法与其它的多标签分类算法进行对比,以验证其良好的多标签分类性能。在对比的过程中,采用十字交叉验证法进行验证,并采用多标签分类的性能评价准则对实验结果进行评价。实验结果表明基于偏最d、---乘回归的多标签分类算法在多标签分类性能上明显优于其它的多标签分类算法。关键词:多标签分类;偏最小二乘回归:性能评价准则;数据挖掘 MIⅡ,TI—LABEL CLASSIFICATION ALGORITHM BASED ON PARTIAL LEAST SQUARES REGRES SION ABSTRACT Inmodern times,as therapiddevelopment puter hardware and software technology,much powerful and reasonable storage es great boost ofthestorage capacity leads totheamazing progress ofthe database technology. Alarge number ofdatabases are used tomanage thehuge data Ollthestorage media. Butthe useful knowledge hidden inthehugedata can notbediscovered,without the powerful management order toeffectivelyapply thisknowledge to science research,frauddetection,production management,market analysis andengineering programming etc.,thedata miningtechnology foruncovering theknowledge have had agreatdevelopment. Classification isanimportant content fordataanalysis indatamining can build aclassifier f