1 / 54
文档名称:

基于数据挖掘的垃圾邮件过滤技术研究硕士学位论文.pdf

格式:pdf   页数:54
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据挖掘的垃圾邮件过滤技术研究硕士学位论文.pdf

上传人:追风少年 2014/3/31 文件大小:0 KB

下载得到文件列表

基于数据挖掘的垃圾邮件过滤技术研究硕士学位论文.pdf

文档介绍

文档介绍:内蒙古大学
硕士学位论文
基于数据挖掘的垃圾邮件过滤技术研究
姓名:李国安
申请学位级别:硕士
专业:计算机技术
指导教师:侯宏旭;李兴华
20080505
基于数据挖掘的垃圾邮件过滤技术研究摘要随着难杆倨占埃缱佑始丫晌O执ㄐ胖饕J侄沃弧H欢始存在却时刻威胁着电子邮件的使用安全。垃圾邮件作为商业广告、恶意程序和不健康内容的携带者,不仅占用网络带宽,同时造成用户时间、金钱上的浪费和情绪上的不良影响,严重侵扰着人们的正常生活。因此,反垃圾邮件行动刻不容缓,其技术也在不断地更新换代。目前,主要有基于口层的反垃圾邮件技术、基于层的反垃圾邮件技术和基于邮件内容的过滤等技术的研发。在数据挖掘的文本挖掘启发下,本文致力于研究基于邮件文本内容上的垃圾邮件过滤技术。本文首先使用正向最大匹配法对邮件样本正文文本作分词处理,得到邮件的特征项。接着,利用互信息减少向量维数,构建邮件样本库。介绍目前比较流行的贝叶斯、⑾蛄空间、朴素贝叶斯等分类方法的原理,对这些算法进行比较分析。针对传统的惴ù在搜索速度慢、样本库容量依赖性强的缺陷,提出了一种基于惴ǖ幕旌戏掷嗥髂P及实现。该算法首先利用各分类器对邮件进行处理得到分类结果,根据分类结果相同和不同决定是否再次进行扑悖庋苊庥械ヒ环掷嗥鞯木窒扌裕芄环⒒用扛龇掷嗥鞯挠通过实验证明,该方法对于中文邮件过滤系统切实可行,效果良好,是一种对邮件进行过滤的新的有价值的尝试。最后,本文提出对多媒体的垃圾邮件过滤、手机中的垃圾短信过关键词:垃圾邮件,数据挖掘,楹戏掷嗥势。滤等科研方向有待进一步地开拓。内蒙古大学工程硕士学位论文
..觚培,瑅基于数据挖掘的垃圾邮件过滤技术研究——琣,,珻瓾,.,.瑃,.,琭.,瑃,,瑃’.,瑂·琻,琒..瑃琻.Ⅱ
图表目录图朴素贝叶斯网络分类器示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.图始讼低车淖芴迳杓啤图分类器组合的结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表垃圾邮件过滤系统的判定结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.表训练邮件数量对分类结果的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯表分类器系统性能测试比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯内蒙古大学工程硕士学位论文
学位论文储躲生糁妇;眨呼蠖期:肆吐日期:锢多一指导教师签名:在学期间研究成果使用承诺书原创性声明应墓直太堂及其他教育机构的学位或证书而使刚过的材料。与我一同鹤鞯耐叶员狙芯克龅娜何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者完全了解学校有关保留、使刚学位论文的规定,即:内蒙占人学有权将学位论知识产权,。作者令后使婕疤ǎ貉诩渲饕Q芯磕学位论文作者签名:本人声明:#本文已经注明引用的内容外,论文中不包含其他人已经发表或撰乍孑过的研究成果,也不包含为获得文的全部内容或部分保留并向国家有关机构、部甁送交学位论文的复印唬瑋:和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学何论文。为保护学院和导师的容或研究成果,须征得内蒙古大学就读期间导师的同意;。
第一章绪论研究的背景及研究意义自从互联网普及以来,电子邮件逐渐成为人们生活中常用的通信手段之一,并且已经成为网络交流沟通的重要途径。然而,凡事都有两面性。在有价值的电子邮件之外,还存在着数量巨大的垃圾邮件>葜泄チM岱蠢始行姆⒉嫉年第一次反垃圾邮件状况调查结果显示:。年中国第一次反垃圾邮件状况调查结果显示,使用收费邮箱的用户每周收到的垃圾邮件比上次调查相比上升了ィ笠涤氏溆没恐苁盏降睦圾邮件较上次上升了ィ夥延氏溆没恐苁盏降睦始肷洗蜗啾壬仙ィ煌氏溆没恐苁盏降睦始慷加胁煌潭鹊纳仙甑谒拇沃国反垃圾邮件状况调查于年月日圆满结束。历时龆嘣鹿踩〉梦示份,经过严格的质量控制体系,,。从这些数据可以看出,垃圾邮件问题已经成为当今网络世界的~个严重问题。大量无用、甚至有害的电子邮件在网络传播,不仅消耗了大量的网络资源,还威胁到邮件系统中用户信息的安全,对邮件服务器本身也提出了严峻的挑战。采取各种有效措施来缓解垃圾邮件的危害,以营造健康和谐的网络环境,已经成为网络安全研究的重要内容。国外很早以前就开始关注垃圾邮件对网络和网络用户的影响。他