文档介绍:⒅俺啤⒀弧⒌ノ幻萍暗刂申请专业学位级别专业名称论文提交日期论文答辩日期学位授予单位和日期答辩委员会主席评阅人注蛔⒚鳌豆适掷喾║》的类号。
。,●一~,瑀~【:一’▲‘一。·
签名:垫耻舢年、詹独创性声明论文使用授权月印日、本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。日期:本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笥ψ袷卮斯娑签名:’
≮;以
、摘要电子邮件作为当今一种方便、快捷的互联网信息交流方式,受到越来越多人的青睐。但是垃圾邮件的出现,并且日益严峻,使这种便利的方式给人带来了烦恼。反垃圾邮件技术已成为互联网信息领域的一个研究热点,基于内容的反垃圾邮件过滤技术更是一种成熟而且有效的技术方案。基于朴素贝叶斯的垃圾邮件过滤方法是当前基于文本内容过滤方法的有效算法之一。随着时间的变化,垃圾邮件的特征也在不断的改变,然而传统的训练模型必须重新进行训练才能适应新的邮件特征的改变。因此,传统的朴素贝叶斯过滤方法必须与其它技术结合才能有效的适应新特征的变化。,是采用数据挖掘领域的流问题解决方案来适应邮件流的问题的解决思路,成为当前的研究热点。本方法是在研究朴素贝叶斯的基本原理,分析其优缺点的基础上,基于传统分类器的静态特性,将概念漂移的思想应用到垃圾邮件过滤系统上,在中文的甁”数据集上,取得了不错的效果,不仅在从精度上,更重要的适应性上,从不适应到适应,从精度低到精度高,完成了一个动态的适应过程。本文首先分析了中文词语的特点和常见的词典结构,解读了朴素贝叶斯算法的基本原理,概念漂移的基本思想,同时给出了通用分类算法评价标准。在第三章,描述了整个系统的总体目标,以及本模块的总体架构,并给予了模块概括性的描述。在第四章,阐释模块内部各个功能点的详细设计和实现,提供了伪代码级的说明了详述。在测试和分析章节,首先详述了中文和英文的语料集,并就该模块系统的参数和数据集选取给予了详细的说明,在概念漂移发生或未发生时,同传统分类器,在精度和适应性上的对比,并做出了详细的分析。综上所述,本系统提出对传统领域的垃圾邮件过滤模型的适应性研究是一个有实践价值、理论意义的尝试。关键字:垃圾邮件、中文分词、朴素贝叶斯算法、概念漂移摘要~幡
蜼
.甌丽..獁琣琻,,,..‘.,琣琤瓵,瓵,瑃,,琭簅;,“.眕,·,.瑃琩,钔琫,~,争卜一
琺琽.,,:,琧琻.,
绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文的背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.国内外垃圾邮件的过滤技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..论文的目的和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文的主要工作和创新点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文的章节安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第二章文本过滤基础理论和研究方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..文本型垃圾邮件的过滤要点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯..概念漂移的基础理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第三章反垃圾邮件适应概念漂移系统的整体架构和功能⋯⋯⋯⋯⋯..反垃圾邮件项目系统整体架构及功能⋯⋯⋯⋯⋯⋯⋯⋯..反垃圾邮件适应概念漂移模块整体架构与功能⋯⋯⋯⋯⋯⋯.道≡褚环掷嗥骷尤ḿ煞掷嘌盗芳芄褂牍δ堋第四章反垃圾邮件适应概念漂移系统设计与实现⋯⋯⋯⋯⋯⋯⋯⋯目录反垃圾邮件系统适应概念漂移模块与其它模块关系⋯⋯⋯⋯...道≡褚环掷嗥骷尤ḿ煞掷嘣げ饧芄褂牍δ堋第一章Ⅳ●一
致洹籪,反垃圾邮件项目背景与结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.反垃圾邮件适应概念漂移系统平台⋯⋯⋯⋯⋯⋯⋯⋯⋯.反垃圾邮件适应概念漂移系统的设计和实现⋯⋯⋯⋯⋯⋯...视Ω拍钇颇?