1 / 75
文档名称:

基于行为解析的反垃圾邮件系统的设计与实现.pdf

格式:pdf   页数:75
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于行为解析的反垃圾邮件系统的设计与实现.pdf

上传人:山吉 2014/2/11 文件大小:0 KB

下载得到文件列表

基于行为解析的反垃圾邮件系统的设计与实现.pdf

文档介绍

文档介绍:东北大学
硕士学位论文
基于行为解析的反垃圾邮件系统的设计与实现
姓名:陈琪
申请学位级别:硕士
专业:计算机科学与技术
指导教师:王兴伟
20070101
摘要基于行为解析的反垃圾邮件系统的设计与实现随着网络技术的不断发展,电子邮件已经成为人们日常生活和工作中沟通的一种重要方式。然而,由于电子邮件先天安全的脆弱性,随之而来的垃圾邮件问题严重困扰着邮件用户,降低了邮件通信的便捷性。目前对反垃圾邮件这一问题已经有了很多研究,出现了很多反垃圾邮件技术。但是,由于垃圾邮件技术也在不断发展变化,这些技术往往只能在不长的时间内发挥作用。行为解析技术作为第三代反垃圾邮件技术的代表,在这样的背景下应运而生。这一技术与传统技术不同主要在于,它不依赖于邮件内容,仅把邮件的行为作为邮件过滤的依据,效率高,性能好。在分析和总结现有行为解析技术研究的基础上,本文设计并实现了基于行为解析的反垃圾邮件系统。系统提出了两种行为解析机制,分别是基于邮件通信人际关系网络的浅层行为解析和基于会话和邮件头信息的深层行为解析。浅层行为解析以用户群组这一概念为核心,而深层行为解析则强调了解析中所使用的数据源。在把两种机制转化为具体模型后,引入了人工神经元网络算法,把模型应用到反垃圾邮件领域中。为了提高运行效率,本文使用了完全散列技术和以神经元为中心的硎痉椒āA硗猓低嘲咽盏降挠始榈挡⒋娲⒌绞菘庵校阌诮窈蟮墓δ扩展和系统升级。本文使用多种指标对实现的系统进行了全面的性能评价。评价结果一方面验证了两种行为解析机制正确性,另一方面表明了基于行为解析的反垃圾邮件系统性能良好。关键词:电子邮件;反垃圾邮件;行为解析;人工神经元网络;用户群组东北大学硕士擘位论文一Ⅱ一
㈣鬴嘲,.—躵;·籅东北大学硕士学位论文..、..,’:;籙一Ⅱ。
陈琪学位论文作者签名:圈采舌典导师签名:独创声明学位论文版权使用授权书签字日期:加一堋签字日期::玻本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示诚挚的谢意。学位论文作者签名:本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。缱髡吆偷际ν馔辖涣鳎朐谙路角┟悍裨蚴游2煌
,电子邮件得到了越来越广泛的应用,它已经成为互联网上最基本的服务之一。用户可以通过电子邮件与远程用户进行经济、方便和快捷的信息交流。目前,互联网上超过%的业务量是电子邮件提供的,再加上企业网内部广泛使用的网络消息传递系统,。用户在收到有用信息的同时,还必须花费大量时间和精力来处理收到的各种各样的广告邮件,这些各种各样广告邮件就属于人们常说的“垃圾”邮件。用户用来写邮件、读邮件和寄邮件的软件称为邮件用户代理等。⒎侵苯咏始偷绞占人手中,邮件在互联网上的路由和传输是通过邮件传输代理完成的,负责投递本地邮件到适当邮箱的软件称为邮件投递代理。上述的和餐钩闪擞始低场当用户要求统鲆环庥始保紫冉ǜ糜始桓惶ㄔ诵蠱软件的服务器。盏組的寄信请求后,它会依据收件人是否是本地系统用户来进行邮件传输。如果收件人是本地用户,则把邮件交给将邮件保存在服务器的邮箱中,供收件人的印⑹杖〔⒋怼H绻占瞬皇潜镜赜没В琈就可能把邮件交给另一个绦写洹U庖还讨校琈和湟约傲礁鯩之间传输邮件的标准协议称为简单邮件传输协议而佑氏渲惺杖∮始男樵蚴怯示中榈版本或始τ眯镮蚧电子邮件传递流程如图所示。发件人连接的ü檠虻腄服务器,得到收件域目诘刂罚缓与该口的号端口衲系亩丝建立连接,使用协议完成邮件的,常见的蠴东北大学硕士学位论文
.缱佑始峁传输。当用户想从邮箱取出邮件时,经常通过拥絇或服务器,由服务器代为访问邮件。常用的服务器有开源的、蚉等,代表发送邮件的会话主要命令、命令在协议中是否必须和命令描述如表电子邮件是由邮件头和邮件体组成的。中明确规定了东北大学硕士学位论文第一章序言性的疘衿饔蠧—和。图甀简化的电子邮件传递流程所示。表会话主要命令衿一
邮件的格式和邮件头必须包含的字段,如“”,“”,“”,“钡茸侄危邮件体的格式则必须遵循T赗中引入多功能始┱筂嘈鸵院螅始慕峁咕痛釉吹ヒ坏慕峁狗展成比较复杂的结构。中的嘈停荕始木琛3<膍类型有三种,分别是痬,痳和痑。图是