1 / 46
文档名称:

基于类关联规则的分类算法研究.pdf

格式:pdf   大小:4,872KB   页数:46页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于类关联规则的分类算法研究.pdf

上传人:zhufutaobao 2021/12/9 文件大小:4.76 MB

下载得到文件列表

基于类关联规则的分类算法研究.pdf

文档介绍

文档介绍:中国优秀硕士学位论文全文数据库 2011年 第S1期 信息科技辑
Chinese Master's Theses Full-text Database 2011, Information Science and Technology I138-1202-1
基于类关联规则的分类算法研究

赵东垒
学位授予单位: 河北大学; 学科专业: 计算机应用技术

摘 要

分类问题是通过分析给定的一个带有类别标识的训练数据集,建立一个分类器,然后预测那些未知类别
的数据对象。基于类关联规则的分类算法,简称关联分类算法是集成了关联规则挖掘技术和分类技术的一种
新的分类算法。它首先挖掘训练集,得到满足最小支持度和最小置信度的类关联规则,然后通过剪枝得到最终
分类规则集。
与传统分类算法相比,关联分类算法具有分类精度高和适应性强的特点。然而,作为一种新的分类方法,
关联分类算法在执行效率,剪枝的质量,分类器的可理解性等方面还存在很多问题。本文针对以上问题对关联
分类算法进行改进。扩展了 TD-FP-growth 算法,用于挖掘类关联规则以提高挖掘效率;综合考虑规则的置
信度和支持度来评价类关联规则的质量,从而克服了传统规则评价方法过分强调规则置信度而导致的过度
拟合问题,使挖掘出的规则具有更高的可理解性;分析了规则交叠现象对分类精度和规则数目的影响。实验
结果表明本文方法在分类精度上优于 SEE5, CBA 和 ,得到很好
的分类效果。

关键词:数据挖掘;;关联分类算法;;类关联规则;;规则评价;;规则交叠

中图分类号:

Abstract

Classification is to construct a classifier by analyzing the training dataset that consists of samples with class
label, and then to classify the unseen samples without class label. Classification based on class association rules, in
short associative classification, is a new classification algorithm that integrates the association rule mining and
classification rule mining. In detail, it mines the training dataset to get class association rules that satisfy the
user-specified minimum su