文档介绍:分类号学号 M200972549
学校代码 1 0 4 8 7 密级
硕士学位论文
智能手机垃圾短信过滤技术的研究
学位申请人: 黄诚
学科专业: 信息安全
指导教师: 彭冰副教授
答辩日期: 2012 年 1 月 11 日
A Thesis Submitted in Partial Fulfillment of the Requirements
for the Degree of Master of Engineering
Research on SMS Filtering Technology on
Intelligent Mobilephone
Candidate : Huang Cheng
Major : Information Security
Supervisor : Vice Prof. Peng Bing
Huazhong University of Science and Technology
Wuhan, Hubei 430074, P. R. China
Jan, 2012
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作
及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文
不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研
究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识
到本声明的法律结果由本人承担。
学位论文作者签名:
日期: 年月日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:
学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允
许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部
或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复
制手段保存和汇编本学位论文。
保密□,在____________年解密后适用本授权书。
本论文属于
不保密□。
(请在以上方框内打“√”)
学位论文作者签名: 指导教师签名:
日期: 年月日日期: 年月日
华中科技大学硕士学位论文
摘要
近些年来,手机短信由于其传递准确可靠、迅速及时和价格低等优点,其发展
尤为迅速。与此同时也使得大量的垃圾短信泛滥成灾,问题已经越来越严重,它不
仅仅越来越严重的影响着人们的正常生活,甚至在一定程度上危害着社会公共安全
和稳定。正因如此,过滤和拦截垃圾短信将成为当前信息通信领域之中一个需要立
刻着手解决的问题,然而,目前的垃圾短信过滤技术主要是基于垃圾短信的某一个
特征进行的简单过滤,如黑白名单、关键词过滤等,存在在明显的局限性和缺陷,
对垃圾短信的过滤力度还不够。
针对当前的现状,提出了一种平衡的基于最小风险朴素贝叶斯决策的垃圾短信
过滤方法。该方法是基于短信内容的,通过收集大量的正常短信和垃圾短信实例,
并结合关键词技术,将垃圾短信关键词和短信实例一起作为朴素贝叶斯文本分类算
法的输入进行训练,然后将实际截获的短信通过该算法进行分类,在分类效果不明
显的时候,采取通过垃圾短信典型特征进行再过滤的手段对其进行再判断,并最终
得出短信类别。并通过自身收集创建的短信语料库对该方法进行了较为全面的实验
分析。实验结果表明,该方法能够准确地对短信进行分类,降低合法短信的分类错
误率,有效提高垃圾短信的查全率,分类召回率达到 90%以上,符合了短信分类要
求。当然,本文设计的过滤方法在实际应用中还存在着各种问题,将在以后的工作
中加以改进完善。
关键词:垃圾短信,文本分类,朴素贝叶斯,最小风险
I
华中科技大学硕士学位论文
Abstract
In recent years, because of its advantage of accurate and reliable, rapid and timely,
low price, SMS has developped , at the same time, it makes lots of spam
messages to problem has been more and more serious, not only does it more
and more serious influences