文档介绍:一种改进的关联规则挖掘算法在入侵检测中的应用研究
张应征成新红
(湖南工程职业技术学院湖南长沙 410114)
摘要: 为了解决网络入侵检测领域使用Apriori算法挖掘频繁模式效率不高、精度不够的问题,本文引入自适应步长跃进、动态修剪候选频繁项集的概念,提出一种新的改进关联规则挖掘算法,该算法较Apriori算法有比较明显的优势, 可以广泛应用于大规模入侵检测数据库的关联规则挖掘中。
关键词: 关联规则; Apriori算法; 入侵检测
中图法分类号:TP391 文献标识码:A
An Improved Algorithm for Mining Association Rules in The Application of Intrusion Detection
ZHANG Ying-zheng, CHENG Xin-hong
(HuNan Engineering Polytechnic HuNan ChangSha 410114)
Abstract: In order to solve work intrusion detection field use Apriori algorithm frequent itemsets efficiency is not high, precision insufficient problems, this article introduces adaptive step jump, dynamic clip candidate frequent itemsets concept, put forward a new algorithm for mining association rules algorithm, the proposed algorithm is Apriori has obvious advantages, and can be widely used in large database of intrusion detection of association rule mining.
Keywords: association rules; Apriori algorithm;Intrusion detection
1 引言
关联规则挖掘是数据挖掘中一个重要的研究内容, 可以从海量数据中发现正常和异常的行为模式, 将其应用于入侵检测不仅可以有效地检测已知入侵, 而且还具有检测未知攻击模式的能力, 具有更高的准确性和适应性。因此研究关联规则的高效挖掘算法对于提高入侵检测的准确性和时效性具有非常重要的意义。
本文在分析经典Apriori算法的基础上,针对其存在的问题提出一种自适应步长跃进的改进Apriori算法-I-Apriori算法。该算法引入自适应步长跃进、动态修剪候选频繁项集的算法优化技术,解决了Apriori算法数据库扫描次数过多、频繁项长度增加时运算时间显著增加,产生候选集数目过大等问题能显著提高算法效率。其算法有较明显的优势,可以广泛应用于入侵检测数据库的关联规则挖掘中。
2 传统的关联规则挖掘算法
定义1 关联规则: 令I = {i1, i2…, im}为项的集合(item set) ,简称项集, D为事务数据库, 其中每个事务T是一个项目子集