1 / 72
文档名称:

垃圾短信过滤系统的设计与实现.pdf

格式:pdf   页数:72页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

垃圾短信过滤系统的设计与实现.pdf

上传人:minzo 2014/2/27 文件大小:0 KB

下载得到文件列表

垃圾短信过滤系统的设计与实现.pdf

文档介绍

文档介绍:电子科技大学
硕士学位论文
垃圾短信过滤系统的设计与实现
姓名:何孝金
申请学位级别:硕士
专业:计算机软件与理论
指导教师:傅彦
20090501
摘要近年来,随着中国手机用户数的增长,手机短消息业务得到了迅猛发展,但同时垃圾短信也以非常快的速度在增长。目前,垃圾短信过滤技术主要有黑名单过滤、关键词过滤和基于文本分类的内容过滤。黑名单过滤和关键词过滤能快速的过滤垃圾短信,但其过滤的准确率不高;基于文本分类的短信过滤的准确率主要依赖于其训练样本的数量及质量,由于日常短信涉及个人的私隐,短信中心从不对外公布,现有的短信样本很少,因此单纯依靠文本分类的短信过滤其准确率也不高。同时,现有的过滤技术都采用逐条检测的方式,对于每天有大量短信息的短信中心来说,其运算量是很大的,这样会造成短信服务中心网络堵塞。因此,从现有的技术上来说,垃圾短信的过滤在准确率和效率方面仍然不能满足现实需本文将针对现有短信过滤技术的不足,研究有效的解决或改进的方法,同时引入新的技术与原有的过滤技术相结合,使垃圾短信过滤系统能够具有更好的过滤性能。本文所做的主要工作如下:芯苛擞τ迷诶绦殴讼低持械墓丶什檎宜惴ǎ盟惴ú捎脀法的多模式匹配思想,通过预处理建立的哈希表来加快匹配速度,并且根据垃圾短信的特征,提出了用压缩存储的树来组织模式串的方法,治隽酥饕5奈谋痉掷嗉际酰氐阈鹗龌谧钚》缦盏谋匆端狗掷嘣诙绦过滤中的应用。岢鲇萌罩痉治龅姆椒ɡ捶治鲆丫说亩绦牛崛∮杏玫氖荩鹿键词库及分类训练样本,实现系统的自我优化。合,在保证短信过滤准确率的情况下,提高短信过滤效率。最后,给出整个垃圾短信过滤系统的设计与实现。关键词:垃圾短信,贝叶斯分类,关键词过滤,日志分析要。加快了查找速度。ū匆端狗掷嘤胄碌墓朔椒包括流量检测、抽样检测、日志分析
一一———————————————————————————————————————————————;,甋,.琭瑆.,:瓵,
。琹瓼,
签名:』互茎垂签名:互互奎耋导师签名:日期:加少日期:加。贶荚履巳独创性声明关于论文使用授权的说明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笥ψ袷卮斯娑
第一章绪论研究背景和研究意义垃圾短信的定义近年来,中国手机用户的数量迅速增长,手机短信业务作为一项新的移动增值业务,由于其发送方便、价格便宜以及随时随地都可以接收等优点使得这项业务在短时间内得到大面积推广,成为了人们进行交流和沟通的一种新方式。据统计【浚晡夜绦欧⑺妥苁课谔酢5窃诙绦乓滴裱杆俜⒄沟耐也带来了一些信息安全方面的问题,很多不法分子利用短信大量发送广告,发送虚假短信进行诈骗,影响人们的正常生活;利用短信散布谣言、煽动闹事,影响社会的安定;利用短信传播反动、色情等消息,危害公共安全。由于这些问题的存在,手机短信的信息安全问题已经得到了全社会的重视,如何在保持短信业务的健康和活力发展的同时限制有害短信的传播、净化短信的内容成为一个急待解决的问题。目前的手段除了在行政法规方面加强对短信发布的管理外,各移动运营商必须在技术上建立短信监控系统,对所有短信内容进行有效的监控和过滤。因此,研究垃圾短信监管与过滤的智能技术,建立一个高效、准确、可靠的短信过滤平台,实现短信内容的过滤,不仅有利于社会稳定和国家安全,保护人民财产和正常生活;同时对于确保运营商设备安全投入,提供一个健康有序的移动通信环境,将直接带动一大批基于短信应用的产业,将产生无法估量的经济效为加大对垃圾短信的打击力度,互联网协会发布《短信息服务规范》和《用户发送短信息指南》U髑笠饧,向广大网民征求相关意见。在《短信息服务规范》征求意见稿中,垃圾短信定义为【浚何淳没庀蛴户发送的用户不愿意收到的短信息,或用户不能根据自己的意愿拒绝接收的短信息,主要包含未经用户同意向用户发送的商业类、广告类等短信息,以及涉及***秽色情、宣扬邪教、赌博、诈骗、侵权、******、病毒、违背宪法原则、攻击益。第一章绪论
、违背社会公德等违法和不良短信息。国内手机垃圾短信大致分为四大类【