文档介绍:一种关联规则增量式挖掘算法研究摘要: 现有关联规则更新算法都是基于支持度- 置信度框架而提出的, 仅针对大于最小支持度闭值的频繁项集进行挖掘。为了提高告警关联规则的完整性和准确性,在相关度 aarsc 算法基础上, 提出了一种增量式挖掘 uaarsc 算法(updating-aarsc) 。该算法对增量计算进行了改进, 可以发现频繁和非频繁告警序列间的关联规则。关键词: 关联规则; 数据发掘; 滑动窗口; 增量计算 an algorithm of associative rule increment mining liu zaoxin ( department of information engineering, jiangxi professional training college of transportation, nanchang , jiangxi 001 , china ) abstract : the existing algorithms of association rule update are based on the framework of support-confidence and they mine only the frequent closure of the set value greater than the minimum support. to enhance pleteness and accuracy, the author presents in this paper an increment mining uaarsc algorithm based on the correlative aarsc algorithm. the algorithm improves putation and may find the associative rules between the frequent and non-frequent alarm sequences. key words : associative rules ; data mining ; sliding window ; putation 0 引言数据挖掘是从大量、不完整、有噪声的随机数据中, 提取隐含在其中、人们不知道但又潜在有用的信息和知识的过程。 agrawal 等人提出了挖掘关联规则的一个重要方法— apriori 算法[1] 。为了挖掘具有时序特征的告警关联规则问题, hatonen 等在 apriori 算法基础上提出了基于滑动窗口的 winepi 算法[2] ,并在 tasa(munications alarm sequence analyzer) 系统中采用了该算法[]。这些算法的处理过程一般分为两个阶段:⑴利用支持度发现频繁告警序列;⑵利用置信度产生关联规则。为了提高算法的效率、减少数据库访问次数, 避免在第一阶段中生成大量候选项目集, han 等人提出了基于fp 树生成频繁项目集的 fp-growt h 算法, 该算法将频繁项集压缩保存在一棵 fp-tree 中, 在一定程度上提高了频繁项集的存取速度,从而提高了挖掘频繁项目集的效率。以上算法都是在高支持度, 高置信度的条件下, 挖掘出告警关联规则。但在挖掘电信