文档介绍:电子科技大学
硕士学位论文
BW-LVQ邮件过滤模型
姓名:王影
申请学位级别:硕士
专业:计算机系统结构
指导教师:卢显良
20050314
要摘伴随着的普及,电子邮件以其快捷、方便、低成本的特点曰益得品一一垃圾邮件,却给没А⑼绻芾碓焙屯绶裉峁┥蘄带来了无尽的烦恼,收件人的时间、带宽和存储资源被无效占用,网络链路因此造成拥本论文课题的主要目标是探索~种具体的垃圾邮件过滤模型,实现并测试该模型。研究中要观察所选择的模型是否适当,注意此模型自身参数和环境参数调本论文提出了始四P秃透慕虰始四P停晗傅拿枋了两个模型的设计原理,讨论了两者之间的关系以及它们与邮件服务器的关系,型特征项离散、垃圾邮件与正常邮件边界定义模糊的问题:改进型邮件过虽然当前已经存在多种多样的垃圾邮件过滤方法,但是还有许多垃圾邮件相关键词:垃圾邮件、学习矢量量化、黑名单、白名单、过滤模型。到了广泛的使用,成为了最流行使用的沟通工具之一。然而,作为其发展的副产塞,还被作为不良信息的载体被到处散发。现在成熟应用的垃圾邮件过滤方法是采用通过软件自动过滤与人工管理相结合的方式,但这不能很好的适应垃圾邮件的多样性,只能过滤掉%左右的垃圾邮件。因此,迫切需要引入更加智能化的垃圾邮件过滤技术来治理日益猖獗的垃圾邮件问题。节对过滤性能的影响,因此,实验需要能够彻底的检测出模型的有效性和可行性。作者在课题研究期间很好的完成了上述目标。并给出了重要的实现框架与代码。始四P徒饩隽瞬级陀始四滤模型针对传统黑白名单模型提出了改进,减少了用户对边界地址错误界定带来关问题没有找到好的解决办法,这大大的影响了邮件过滤系统的过滤性能,使得垃圾邮件的危害没有减轻。本论文提出的新的邮件过滤模型解决了其中的一些问题,在一定环境下能够提高邮件过滤系统的过滤性能,因此,本课题的研究是具的损失。有意义的。
甋瑃琖,,,琫—瑂琣甃】,瑃,%甀甆:,.,痶甌,琺..琇,琣,甀甌,.,.痩,
丝圣墅关于论文使用授权的说明独创性声明日期:《纺辍月一签名:日期:文柙斗年·文月导师签名:本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的构的学位或证书而使用过的材料。与我一同工作的同志对本研究所傲的任何贡献本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机均已在论文中作了明确的说明并表示谢意。权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笥ψ袷卮斯娑
第一章引言背景品一一垃圾邮件,却给没А⑼绻芾碓焙屯绶裉峁┥蘄带来了还需要小心的判别垃圾邮件和正常邮件,阻免影响正常事务。垃圾邮件还占用了接收方的带宽和存储资源。许多用户是以接入绲氖奔湓は戎Ц斗延百万,甚至上亿份,占用了大量的带宽资源,严重时会拥塞整个绰罚中断部分线路的运营。垃圾邮件还利用别人的服务器转发邮件,造成了网络安全隐患。垃圾邮件还带来了社会问题,如一些含有暴力、欺诈等各种不良信息的邮平等自愿交流的规则。联合国贸发会议原引垃圾邮件起源于美国,在二十世纪九十年代曾经一度泛滥。经过不懈努力,包括技术上和法律上的,目前美国的垃圾邮件正在逐年减少,而垃圾邮件的源头正逐渐转到了中国及东南亚的一些国家和地区。由于中国网络的迅速普及,国内出的垃圾邮件迅速增加。部分国外公司甚至利用中国没有相关的法律限制,直接在中国设立公司从事此类商业活动。这些行为带来的后果是使中国成了究。国内的邮件服务提供商所采用的反垃圾邮件的主要手段是通过软件自动过滤但是这些方法相对简单,不能很好的适应垃圾邮件的多样性,只能过滤掉%左伴随着的普及,电予邮件以其快捷、方便、低成本的特点日益得到了广泛的使用,成为了最流行使用的沟通工具之一。然而,作为其发展的副产无尽的烦恼。垃圾邮件占用收件人的宝贵时间,用来删除驱之不散的垃圾邮件,的,大量的垃圾邮件使得这些用户不得不花去一定的时间来下载毫无意义的内容。对大部分用户来讲,邮箱的大小都是限额的,多一份垃圾邮件,正常邮件就少了一份存储空间。而且,垃圾邮件往往是网络资源的盗用,影响到了网络管理员和墓ぷ鳌5鼻癐缱试椿贡冉嫌邢蓿始看畏⑺蜕贤颉件,可能诱导收信人的判断能力,特别是容易误导辨别是非能力还较弱的未成年入。另外,发送垃圾邮件的行为还违背了开放、民主、平等的文化,不顾他人的反对,强制性的把邮件发到别人的邮箱,侵犯了个人的隐私权,打破了的数据说,垃圾邮件给全球企业带来的损失高达诿涝!尽縧。一些商业机构也看到了这