1 / 3
文档名称:

一种量化关联规则挖掘算法.pdf

格式:pdf   大小:532KB   页数:3页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种量化关联规则挖掘算法.pdf

上传人:宝钗文档 2022/1/30 文件大小:532 KB

下载得到文件列表

一种量化关联规则挖掘算法.pdf

相关文档

文档介绍

文档介绍:计 算 机 工 程 2007 年 5 月
第 33 卷 第 10 期 究人员提出了许多挖掘布尔型关联规则的算 每个区间内具有相同数目的数据项。等宽法和等深法都简单
法[2~4]。挖掘数值型和分类型关联规则并不像布尔型那样容 直接,以至于分区没有意义,也不能处理最小可信度问题。
易。然而,许多现实世界的数据库存在大量的数值型和分类 在文献[5]中,Skikant 和 Agrawal 引入了一种称为部分完全匹
型的数据,现有的解决方法不足以解决这种情况。 配的、用于测量分区带来的信息损失的度量,并且提出了一
关联规则是一种形如 XY⇒ 的规则,其中 X 和 Y 是项目 种分区算法。在文献[6]中,Miller 和 Yang 指出了等深法的缺
的集合。它说明如果 X 在数据库中发生,那么 Y 也会以一定 点,并且提出了数值型属性分区的指导原则。在选择数据区
的概率发生。有两个重要的参数与一个关联规则相联系:支 间或数据集合的时候,他们期望能有反应数据间距离的度量。
持度和可信度。支持度描述一个规则的重要性,而可信度描 由于认为把较近的数据放在一起更有意义,因此考虑了数据
述规则发生的可能性。关联规则挖掘算法中最重要的部分是 间的距离。为了达到这个目的,提出了关联规则的一种更通
发现频繁项目集。该过程受到用户给定的最小支持度的影响。 用的形式,并且使用聚类算法来发现数据的子集。他们提出
[7]
关联规则的一个重要的应用是 1993 年 Agrawal 等人提出 了一个使用 BIRTH 在数值型属性上发现聚类进而形成数据
的购物篮分析问题[2]。在购物篮分析问题中,数据是布尔型 项,然后使用布尔性关联规则挖掘算法 Apriori 进行挖掘的算
的,值是“0”,或者“1”。经典的数据挖掘算法是为布尔型 法。在该算法中