1 / 66
文档名称:

关联规则挖掘算法的研究.pdf

格式:pdf   页数:66页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关联规则挖掘算法的研究.pdf

上传人:pk5235 2015/9/24 文件大小:0 KB

下载得到文件列表

关联规则挖掘算法的研究.pdf

相关文档

文档介绍

文档介绍:论文题目:关联规则挖掘算法的研究
专业:计算机应用技术
硕士生:何洪德(签名)
指导教师:杨君锐(签名)
摘要
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,
提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。关联规
则挖掘是数据挖掘研究领域中的一个重要分支,其主要是研究和发现实际应用中数据属
性之间的关联关系。
本文针对关联规则挖掘算法的相关问题在广泛查阅国内外文献的基础上进行了研
究和分析。本文的研究工作主要集中在以下两点。
首先,提出了一种分布式全局最大频繁模式挖掘算法(DMGMFP)。该算法包含局部
挖掘与全局挖掘两个阶段。在局部挖掘阶段,首先在各站点上分别建立频繁模式树
(IFP_tree),并使用有序方式存储频繁项目,然后通过对各局部数据库的扫描,来挖掘出
局部最大频繁模式。在全局挖掘阶段,利用各局部数据库生成的最大频繁模式和组通信
播报消息的方式,从而挖掘出全局最大频繁模式的集合。通过对算法的实现以及与相关
算法的测试比较和在多种情况下的测试结果表明,DMGMFP 算法具有较好的性能。
其次,提出了一种滑动窗口模型与时间衰减模型相结合的数据流频繁闭合模式挖掘
算法(MFCPA-stream)。当数据流流过时,该算法通过动态构建带项目头表的完全合并排
序模式树(HMSP-tree),及时捕获数据流上最新的模式信息。同时利用剪枝与合并策略维
护 HMSP-tree。实验表明,MFCPA-stream 算法具有较好的性能。




关键词: 数据挖掘;关联规则;全局最大频繁模式;数据流;频繁闭合模式

研究类型: 理论研究
Subject : Research on the Mining Algorithms of Association Rule
Specialty : Computer Application Technology
Name : He Hongde (Signature)
Instructor : Yang Junrui (Signature)
ABSTRACT
Data mining is the process of abstracting unaware, potential and useful information and
knowledge from plentiful, plete, noisy, fuzzy and stochastic data result of practical
application. Association rules mining is an important branch of research in the field of data
mining. It researchs and finds mainly the interesting relationship among attributes in those
data result of practical application.
By reading the documents at home and abroad, some association rules mining algorithms
were this paper, the research is focused on the following two points.
Firstly, a new algorithm, named Distributed Mining Global Maximum Frequent Pattern
(DMGMFP), for mining distributed global maximal frequent patterns from databases was
proposed. DMGMFP had the local mining phase and the global mining phase. During the
local mining phase, first DMGMFP created respectively the tree named Improved Frequent
Pattern tree (IFP-tree) on each node and used figure sequence to store frequent patterns, then
it discovered the local maximal f