1 / 53
文档名称:

基于正相关关联规则的分类算法.pdf

格式:pdf   大小:2,478KB   页数:53页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于正相关关联规则的分类算法.pdf

上传人:zhufutaobao 2021/11/23 文件大小:2.42 MB

下载得到文件列表

基于正相关关联规则的分类算法.pdf

相关文档

文档介绍

文档介绍:授予单位代码
学号或申请号
士郑 州学 位大 论学
硕 文
论 文 题 目 基 于正相关关联规则 的分类算法
作 者 姓 名 李 睿 楠
学 科 门 类 工 学
专 业 名 称 计算机软件与理论
导师姓名 、 职称 范 明 教授
二零零七年五 月
郑 重 声 明
本人的学位论文是在导师指导下独立撰写并完成的, 学位论文没有票窃 、抄
袭等违反学术道德 、 学术规范的侵权行为, 否则, 本人愿意承担由此产生的一切
法律责任和法律后果 , 特此郑重 声明 。
才 管 叔
学位论文作者 签名 十 有 `叩
叫 年 夕月 介 日
基于正相关关联规则的分类算法
摘 要
分类 是数据挖掘研究 中的一个基本任务 , 关 联规 则挖掘 是数据挖 掘研 究 中的
一个重要领域 , 把 关联规则挖 掘用 于分类 问题开辟 了数据分类 的一条新路 。常见
的基于关联规则分类算法通常在训练数据集上生成关联规则 的全部集合 , 然后选
择一个高质量 的规则子集作为分类规则集去分类和预测测试数据集 。
研究表明, 基于关联规则分类具有高准确率和强适应性的特点 。但是, 在生
成的分类器中, 往往会产生大量的分类规则, 而其中很大一部分的分类规则可能
对分类并没有好处 。并且, 有 时因为选取单一高置信度 的规则 , 使分类 结果产生
了过分拟合 。因此, 基于关联规则的分类算法, 其关键在于分类器也就是分类规
则集的建立 。而且对挖掘得到的分类规则集需要有不 同的度量去评估其分类性
育琶。
如何产生更有意义 的关联规 则, 如何使用有意义 的关联规则对测试数据集进
行分类 , 是本文研 究的主要 内容 。本 文提 出了一种 新的关联分类算法 。
该方法对 一 算法进行 改进 , 在频繁项集产生 的过程 中, 引入正相关性 的
判断, 使最后生成的频繁项集是正相关的, 并使用正相关的频繁项集得到正相关
的初始分类规 则集 。为 了提高分类准确率和效率 , 再利用置信度对初始分类规则
集进行规则选取 , 生成 由正相关关联规则组成 的分类器 。分类 时, 本文算法首先
在每个分类器 中选 取分类 规则 , 这些分类规 则可 以分类测试事 务, 每条分类规则
都有一个了权值, 然后计算每个分类器中选取出的分类规则的权值和, 比较权值
和最大 的分类器 的类标号 与测 试事务 的类标 号 , 两个类标 号一致 则表示分类 正