1 / 142
文档名称:

基于正相关关联规则的分类算法.pdf

格式:pdf   大小:1,750KB   页数:142页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于正相关关联规则的分类算法.pdf

上传人:aena45 2021/4/9 文件大小:1.71 MB

下载得到文件列表

基于正相关关联规则的分类算法.pdf

文档介绍

文档介绍:摘要都有一个夕权值,然后计算每个分类器中选取出的分类规则的权值和,比较权值分类是数据挖掘研究中的一个基本任务,关联规则挖掘是数据挖掘研究中的一个重要领域,把关联规则挖掘用于分类问题开辟了数据分类的一条新路。常见的基于关联规则分类算法通常在训练数据集上生成关联规则的全部集合,然后选择~个高质量的规则子集作为分类规则集去分类和预测测试数据集。研究表明,基于关联规则分类具有高准确率和强适应性的特点。但是,在生成的分类器中,往往会产生大量的分类规则,而其中很大一部分的分类规则可能对分类并没有好处。并且,有时因为选取单一高置信度的规则,使分类结果产生了过分拟合。因此,基于关联规则的分类算法,其关键在于分类器也就是分类规则集的建立。而且对挖掘得到的分类规则集需要有不同的度量去评估其分类性行分类,是本文研究的主要内容。本文提出了一种新的关联分类算法该方法对.算法进行改进,在频繁项集产生的过程中,引入正相关性的判断,使最后生成的频繁项集是正相关的。并使用正相关的频繁项集得到正相关的初始分类规则集。为了提高分类准确率和效率,再利用置信度对初始分类规则集进行规贝Ⅱ选取,生成由正相关关联规则组成的分类器。分类时,本文算法首先在每个分类器中选取分类规则,这些分类规则可以分类测试事务,每条分类规则和最大的分类器的类标号与测试事务的类标号,两个类标号一致则表示分类正确。最后根据正确分类的测试事务数与总测试事务数得出本文算法在某事务数据集上的分类准确率。实验表明,虽然本文算法在生成分类规则集的时候,删除了以与.虲噫敲溃宜惴ㄔ诵械氖奔淇O飨越档汀关键词:分类;频繁项集;关联规则;正相关能。如何产生更有意义的关联规则,如何使用有意义的关联规则对测试数据集进大量的关联规则,但是在餮暗鍪菁校钪盏姆掷嘧既仿士基于正相关关联规则的分类算法
湎柚.曲甌甌它曲#甒甀阛瓾甒....甧.甀瓹.瓹,,基于正相关关联规则的分类算法,·.Ⅱ.
篶籪;籶—基于正相关关联规则的分类算法..,
第一章引言挖掘得到的关联规贝目——即用于分类的分类规则,我们需要有不同的度量。对关芯勘尘凹耙庖分类是数据分析的一种重要形式,也是数据挖掘研究中的一个基本任务,可以用于提取描述重要数据类的模型或预测未来的数据趋势。关联规则挖掘是数据挖掘研究中的一个基本任务,同时是一个高度活跃的领域,把关联规则挖掘用于分类问题开辟了数据分类的一条新路。基于关联规则的分类算法,其关键在于分类器也就是分类规则集的建立。对联规则的度量常使用支持度一置信度框架。但基于支持度一置信度的关联规则挖掘可能产生负相关的关联规则。因此,考虑关联规则的相关性将会使挖掘得到的目前利用关联规则进行数据分类已经产生了不少成熟算法,其中的某些算法无论在时间复杂度、空问复杂度还是分类的准确率上都比传统的分类算法有相当程度的提高。在这些算法中,有些考虑到了规则前件粜约和规则后件标号南喙匦裕雇诰虻降拇欣啾旰诺墓亓9嬖蚋幸庖濉5钦庑┧惴ǘ没有考虑到规则前件粜约中的属性之间的相关性,因此产生的用于分类时,产生的用于分类的关联规则很容易规模巨大,而其中很大一部分的分类规则可能对分类并没有好处。因此,如何产生更有意义的关联规则,如何使用有意义的关联规则对测试数据集进行分类,是本文研究的主要内容。本文的主要工作本文根据当前的实际需要并结合国内外在基于关联规则分类方面的研究进展和研究成果,对如何在分类规则集产生的过程中进行相关性判断进行了研究,并在此基础上提出了一种新的基于正相关关联规则的算法惴ā本文的主要工作包括以下几个方面:猿<姆掷嗨惴ń蟹治觯芙崴堑挠湃钡悖鼋邢喙匦耘卸关联规则更有趣、更有意义。的关联规则可能是没有意义的。当这些算法用于数据量和维数都非常大的数据库基于正相关关联规则的分类算法
愿盟惴ǖ男阅芙辛耸笛榉治觥对产生分类规则集的必要性;哉喙仄捣毕罴母拍罱兴得鳌2⒔樯芰思钢窒喙匦缘亩攘坎呗裕对这几种度量策略的特点进行了分析;慕艘恢种苯釉贔皇髦型诰蚱捣毕罴乃惴ǎ喙氐姆掷喙则,并在正相关关联规贝侠弥眯哦冉泄嬖蜓∪。煞掷嗥鳎褂梅掷嗥对测试数据集进行了分类;本文以产生分类规则过程中的相关性判断为中心,研究了相关分析和相关性本文的内容组织围绕前述研究内容,本文各章节安排如下:第一章为本文的引言部分。介绍了课题研究的背景及意义,给出了论文的主要工作以及本文的组织结构。第二章介绍了常见的基于关联规则的分类算法,并详细介绍了两种最主要的用于基于关联规则分类的分类器的产生算法。第三章是关联规则的相关性分析,说明了正相关关联规则的概念,并对常见的相关性度量做出了简要介绍。第四章按照一般基于关联规则的分类算法的步骤,对本文算法做出了思想描述和代码分析。第五章是实验结果和分析,选择了多个测试数据集和多个基于关联规则的分类算法作为实验数据对比,最后比较了算法的性能。第六