1 / 54
文档名称:

基于关联规则挖掘的分类算法研究.pdf

格式:pdf   大小:31,700KB   页数:54页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于关联规则挖掘的分类算法研究.pdf

上传人:zhufutaobao 2021/11/17 文件大小:30.96 MB

下载得到文件列表

基于关联规则挖掘的分类算法研究.pdf

相关文档

文档介绍

文档介绍:西安科技大学
硕 士 学 位 论 文
基于关联规则挖掘的分类算法研究
专业名称: 计算机应用技术
作者姓名: 许立莎
指导老师: 杨君锐
论文题目:基于关联规则挖掘的分类算法研究
专 业:计算机应用技术
硕 士 生:许立莎 ( 签名 )
指导教师:杨君锐 ( 签名 )
摘 要
随着社会信息化的高速发展, 数据挖掘技术在各领域的重要作用日益凸显出来。分
类是数据挖掘领域的一种重要分析手段, 而关联规则挖掘是数据挖掘领域的一个重要研
究方向, 两者作为数据挖掘中两个高度活跃的研究领域, 有着一定的相似性—挖掘关联
性强的项目集。由此以来, 将这两项重要技术组合在一起, 即把关联规则挖掘用于分类
任务, 便开启了数据分类的新征程—关联分类。
关联分类实质上就是基于关联规则的分类, 它既反映了知识的应用特点—分类或预
测, 又体现了知识内在的关联特性。各关联分类方法之间的不同之处主要体现在两个方
面:挖掘频繁项集所用的方法和如何分析挖掘出的规则并将其用于分类。
本文在分析与比较现有关联分类算法的优势和不足的基础上, 提出了一种基于
树的关联分类算法 。算法使用垂直数据格式来压缩存储原始数据库, 在减
少数据库扫描次数的同时, 方便支持数计数, 从而提高算法效率;算法把频繁项集视为
字符串, 采用 树来存储频繁信息, 然后挖掘分类关联规则, 另外, 其在 树
构造过程中加入对频繁项类别标签支持数的计数, 使其能直接去除不能生成频繁规则的
频繁项目, 相当于对 树的预剪枝, 可有效减少 树的节点数目, 进而减少挖
掘过程的遍历时间。实验结果表明, 该算法的分类准确率和算法效率相对 和
算法有所提高, 算法克服了 算法中存在冗余节点的不足, 明显节省了内存空间。
因此, 该算法是有效可行的。
关 键 词:;数据挖掘;关联规则挖掘;分类算法;关联分类; 树
研究类型: 理论研究
S u b j e c t : R e s e a r c h o f C l a s s i f i c a t i o n A l g o r i t h m B a s e d o n A s s o c i a t i o n
R u l e M i n i n g
S p e c i a l t y : C o m p u t e r A p p l i c a t i o n T e c h n o l o g y
N a m e : X u L i s h a ( S i g n a t u r e )
I n s t r u c t o r : Y