文档名称：

基于FP—Growth关联规则算法接警参数挖掘研究.docx

格式：docx 大小：61KB 页数：8页

下载后只包含 1 个 DOCX 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

基于FP—Growth关联规则算法接警参数挖掘研究.docx

上传人:小博士 2019/4/17 文件大小：61 KB

下载得到文件列表

基于FP—Growth关联规则算法接警参数挖掘研究.docx

相关文档

文档介绍

文档介绍：基于FP—Growth关联规则算法接警参数挖掘研究摘要:本文围绕110接警参数中的接警类别等实战参数,研究了FP-Growth关联规则算法在大城市110接警参数中的数据挖掘分析与应用问题。关键字:关联规则;算法;接警类别;接警类型;分析中图分类号::ADOI:.1003-:[1]高家明,薛京生,-Growth关联规则算法的接警参数挖掘分析[J].软件,2013,34(8): 67-690引言关联规则挖掘的研究大体经历了4个阶段:第一阶段,关联规则原始问题研究,即购物篮分析或单维单层布尔型关联规则挖掘(频繁项集挖掘)研究;随着应用需求的发展,关联规则形式出现了很多扩展,即进入第二阶段,包括:多层关联规则、多维关联规则、量化关联规则、基于约束关联规则等研究;第三阶段,是对关联规则一般性问题的研究,即规则完备性,规则兴趣度和度量,规则挖掘语言等方面的研究;随着多种数据形式的出现,关联规则概念出现新的扩展(即一般化的频繁模式),关联规则挖掘进入了第四个阶段,如序列模式挖掘,时序模式挖掘,子结构挖掘等。关联规则挖掘问题是通过用户指定最小支持度和最小可信度来寻找强关联规则的过程,即关联规则挖掘问题可划分成两个重要的子问题:子问题1:发现频繁项目集。通过用户设定的最小支持度,寻找所有频繁项目集,即满足支持度大于或等于最小支持度的所有项目子集。发现所有的频繁项目集是形成关联规则的最重要基础。子问题2:生成关联规则。通过用户设定的最小可信度,在每个最大频繁项目集中,寻找可信度大于或等于最小可信度的关联规则。相对于第1个问题而言,第2个问题处理起来相对简单,且在内存、I/O以及算法效率上改进的余地不大。所以关联规则挖掘的研究主要集中在第1个问题即发现频繁项目集方面,因而产生了许多优秀的产生频繁集的算法。对于发现频繁项目集的研究,关联规则算法可按照是否生成频繁项集的候选项而分成两大类:一类是产生频繁项集候选项的算法,另一类是不产生候选项的算法。对于这两类关联规则算法,最具有代表性的是Apriori和FP-Growth算法。本文应用FP-Growth算法,对城市110接警参数进行数据挖掘和分析。1FP--tree算法。这个算法挖掘频繁项目集的基本思想是分而治之,即使用FP-tree递归增长频繁集的方法:对每个项,生成它的条件模式库,然后是它的条件FP-tree;对每个新生成的条件FP-tree,重复这个步骤;直到结果FP-tree为空,或只含惟一的一个路径(此路径的每个子路径对应的项目集都是频繁集)。可见,FP-tree算法只进行2次数据库扫描。它不使用候选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。该算法构造频繁模式树的过程如下:按Apriori算法,扫描数据库一次生成1-频繁集,并把它按降序排列,放入L表中;创建根节点,并标志为null,扫描数据库一次;当得到数据库的一个项目集(即一个元组)时,就把其中的元素按L表的次序排列,然后递归调用频繁模式树的生成(FP-growth)来实现FP-tree的增长。-tree的挖掘步骤如下:为FP-tree中的每个节点生成条件