文档介绍:上海交通大学
硕士学位论文
基于数据挖掘的入侵检测技术研究
姓名:吉磊
申请学位级别:硕士
专业:通信与信息系统
指导教师:薛质
20070101
基于数据挖掘的入侵检测技术研究
摘要
随着 在全球的普及和发展,计算机网络已经和人们的
学习、工作紧密的联系在一起。然而网络攻击与入侵行为对于国家安
全、经济、社会生活造成了极大的威胁。因此,信息安全问题逐渐成
为信息产业的焦点问题,并已成为国家安全的重要组成部分,也是决
定国家经济能否持续高速发展的关键。
入侵检测是信息安全技术的重要组成部分,涉及日志分析、漏洞
检测、攻击路径检测等多种技术,这些技术在很大程度上依赖包括数
据挖掘技术在内的多种数据分析和计算技术的发展。而数据挖掘结合
统计和计算技术,从大量的数据集中获取有用的模式,从而能对数据
库中数据属性、对象集进行有效的描述,产生指导性的规则集合,提
供给决策支持系统。作为机器学习在数据库中的应用,数据挖掘研究
可以在关联规则和序列模式等几方面对入侵检测、攻击路径检测等提
供依据,从而为制定防护策略做出贡献。本文在理解数据挖掘算法的
基础上,提出算法的改进方法,并着重研究将数据挖掘技术应用于网
络安全审计数据中,对安全日志中的数据进行关联性分析,以发掘出
入侵数据包的特征和攻击序列模型,从测试数据集中构造出入侵模
型。
本文前三章分别简要介绍信息安全,入侵检测和安全日志的相关
概念和基本原理;第四章重点介绍数据挖掘技术,包括了关联规则分
析,序列分析,分类分析和聚类分析;第五章论证数据挖掘技术应用
于入侵检测系统的必要性和实施的系统架构;第六章详细说明实验流
程和实验过程中对关联规则算法的改进,其中重点研究了运用 K-均
值算法对审计日志做预处理和在实现关联规则挖掘时,如何改进
Apriori 算法,使之能在面对安全日志这种高维度数据时比原有算法
效率获得大幅度提高;在第七章中对所做的工作作出总结并对未来的
研究任务提出建议。
关键词:入侵检测,安全日志,数据挖掘,聚类分析,关联性分析,
Apriori 算法
RESEARCH OF INTRUTION DETECTION
TECHNOLOGY BASED ON DATA MINING
ABSTRACT
With the development of , work plays an increasingly
significant role in the daily life. However, the intrution and attack from
work damages the stability in the security, economy and other
aspects in the society. So the information security issue is guadually
ing the hottest point.
Intrution Detection is one of the most important parts in the
information secutity technology, including the log analysis, vulnerability
detection and so on. Almost all the technologies partly rely on the
development of the data analysis putation technology, including
data mining.
Data mining bined the statistics and
computation ,can get the useful and protential information from the large
mount of data ,so it can describe the future activity or trend of the entities
on work and help to the decision making for security by gnenrating
the sets of the the rules got from the data for guidance.
Based on the further understading of the data mining algorit