1 / 63
文档名称:

关联规则挖掘相关算法与研究.pdf

格式:pdf   页数:63页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则挖掘相关算法与研究.pdf

上传人:2028423509 2016/1/5 文件大小:0 KB

下载得到文件列表

关联规则挖掘相关算法与研究.pdf

文档介绍

文档介绍:西南交通大学硕士学位论文关联规则挖掘相关算法研究姓名:毛艳慧申请学位级别:硕士专业:计算机应用技术指导教师:陶宏才20090601西南交通大学硕士研究生学位论文第1页摘要数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。在数据挖掘技术发展繁荣的大背景下,关联规则技术得到了蓬勃发展,并正朝更为广泛而深入的方向继续发展。关联规则挖掘作为数据挖掘领域的一个重要研究分支,它的任务是发现所有满足支持度阈值和置信度阈值的强关联规则。近年来,关联规则挖掘研究己经成为数据挖掘中的一个热点,并被广泛应用于市场营销、事务分析等应用领域。关联规则挖掘算法是关联规则挖掘研究的主要内容,迄今为止己提出了许多高效的关联规则挖掘算法。本文对关联规则挖掘进行了系统的分析与研究,并在已有研究的基础上提出了两个改进算法。论文的主要工作如下:(1)对关联规则挖掘的基本理论进行了总体研究,包括关联规则挖掘的基本概念、分类、挖掘过程、改善关联规则挖掘质量的主要策略等,并在此基础上分析了关联规则的扩充问题,从而指出关联规则挖掘的研究方向。(2)对关联规则经典算法Apdori作了全面的分析,指出了挖掘中的关键步骤并提出算法的不足,并分析总结了二进制算法和矩阵算法的相关研究,提出了一种基于频繁项集矩阵的关联规则挖掘算法。该算法不需要生成频繁候选项集,并且只需要扫描事务数据库一次,采用频繁项集矩阵存储事务数据并对其约简,占用的存储空间也少得多。理论分析和测试实验证明了新算法在性能上的优越性。(3),结合用户访问模式的特点,。该算法将Web用户的会话集映射为一棵访问模式树,然后在访问模式树上挖掘频繁访问模式并生成模式数组,最后在模式数组中找到所有的频繁访问模式。利用挖掘出来的模式知识,可以更好地对Web站点进行设计与维护。关键词:数据挖掘;关联规则;Apriori算法;频繁项集矩阵;,,intheprosperousbackgroundofdataminingtechnology,-branchofthedatamining,,,,:(1)Thebasictheoriesforassociationruleminingarediscussedsystematicallyinthisthesis,oncepts,classification,miningprocess,thevalueofmeasurement,andonthisbasisananalysisoftheexpansionoftheissueofassociationrules,pointingoutthattheassociationruleminingresearch.(2)Aftertheclassicalgorithmofassociationrules,