文档介绍:反垃圾邮件技术分析与中文垃圾邮件过滤规则研究
孙东红陈光英
中国教育和科研计算机网紧急响应组
(Computer Emergency Response Team of China Education and work)
清华大学信息网络工程研究中心
(Network Research Center of Tsinghua Univ.)
主要内容
垃圾邮件的情况
反垃圾邮件技术分析
垃圾邮件的定义
垃圾邮件历史
现状分析
中文垃圾邮件过滤规则研究
CCERT开展的反垃圾邮件工作
垃圾邮件的定义
垃圾邮件:普通意义上的垃圾邮件指的是未经主动请求的大量的电子邮件, SPAM, UBE(Unsolicited Bulk Email), UCE (mercial Email)
收件人事先没有提出要求或者同意接收的广告、电子刊物、各种形式的宣传品等宣传性的电子邮件;
收件人无法拒收的电子邮件;
隐藏发件人身份、地址、标题等信息的电子邮件;
含有虚假的信息源、发件人、路由等信息的电子邮件。
1985 年8 月一封通过电子邮件发送的链锁信,一直持续到1993 年,这是首次关于垃圾邮件的记录。
1993 年6 月份, 上出现了名为“Make Money Fast”的电子邮件。
1994 年4 月份,Canter &Siegel 的法律事务所把一封移民顾问服务广告邮件发到6000 多个新闻组,一时间群情激奋。--首次用spam称呼垃圾邮件。
1995 年5 月出现第一个专门的垃圾邮件群发软件Floodgate。
分析:简单邮件传输协议(SMTP)协议安全性存在不足:
SMTP基于RFC 524发展而来,RFC524是在1973年提出的,它不是一个安全的命令集。这使得SMTP缺乏安全性保障。
发展历史
现状分析-数据统计
全球范围统计,2001年垃圾邮件仅占电邮总量的7%,到2002年即达到29%,至2003年7月就超过了51%,2004年1月高达60%
垃圾邮件的数量已经超过了合法电子邮件的数量。
现状分析-我国垃圾邮件形势严峻
2003年终统计显示:中国邮件服务器总计接收到的垃圾邮件为1500亿封,用户实际共计收到垃圾邮件470亿封,经济损失48亿。 
《第十四次中国互联网络发展状况统计报告》显示,,,。
网民每周收到的垃圾邮件数是非垃圾邮件数的两倍!!
商业宣传邮件
政治宣传邮件
色情宣传邮件
病毒邮件
现状分析--常见垃圾邮件类型
爱虫( 2000-2-14)、
nimda(2001-9-19)、
求职信(2001-10-26)、
中文版求职信(2002-年5-10)、
怪物(2002-10-02)、
sobig(2003-1-11)、
爱情后门(2003-2-25)、
小邮差(2003-8-04)、
斯文(2003-9-19)、
MyDoom (SCO炸弹)(2004-1-27)
Netsky及其变种(2003-今)
发件人地址随机变化
邮件主题随机变化
伪造邮件头干扰信息
信体内容随机变化内容
正文以图片方式显示,难以识别
对垃圾邮件的定义和分类因人而异
垃圾邮件在不同时段内的传播内容不一样
垃圾邮件在不同范围内的传播内容不一样
现状分析—垃圾邮件的特点