文档介绍:么砀酷括厂:篜
。■.,
孱ɑ一一~一一一~论文作者签名:鼋安沁良搬脚论文作者签名:毫枣橇日期:弘吼月乡日论文作者签名:嚏鼍谋段獬心~鹤勘日期:昝旅日期:’薛毛月≥日学位论文版权使用授权说明杰垄提论一文意一论显稚维对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人本人完全了解海南大学关于收集、保存、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权海南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本人在导师指导下完成的论文成果,知识产权归属海南大学。保密论文在解密后遵守此规定。本人已经认真阅读“咝Q宦畚娜氖菘“咝Q宦畚娜氖菘狻敝腥姆⒉迹⒖砂师期一师期承担。~,,唠:,:¨.
.ぃ弧#弧甶’..
捅要着移动通信技术的发展和手机普及率的提高,手机短信业务正以其迅速、方便、廉等优势日益成为人们生活中的一种重要通信和交流方式。在短信业务给用户带种方便的同时,大量的垃圾短信也随之出现,是困扰运营商和用户的一个重大问此,我们有必要将这些垃圾短信过滤掉。前,垃圾短信过滤技术主要有黑名单过滤、关键词过滤和基于文本分类的内容过基于短信的发送方式,可以考虑从两个方面对垃圾短信进行过滤,一种是在短消中心对垃圾短信进行过滤,另一种是在手机终端对垃圾短信进行过滤。但这两种方法都存在着不足。本文针对目前短信过滤技术的不足,将新的技术与现有的技术相结合,对手机垃圾短信过滤系统进行研究和实现。为了更好地实现对垃圾短信过滤,本系统着重考虑了在手机终端的过滤方式,通过将黑名单技术与文本分类技术相结合,并且利用了贝叶斯分类方法对短信内容进行分类识别,最终来实现对垃圾短信的过滤。本文完成的主要工作可以概括如下对短信过滤系统所涉及到的主要算法进行了研究,重点叙述基于贝叶斯分类算法在短信过滤中的应用。根据现有的算法,对短信过滤系统进行了设计和实现。这是全文的重点,其中主要成果和创新点包括:被实现的系统最终完全可以在手机开发平台上实现,这说明最终可以脱离电脑而全部在手机终端上运行;考虑的手机终端的存储器限制,对本地字典的设计进行了改进,大大减小了字典的体积;对字典的使用方式进行了改进,使之不仅在体积上得以优化,在匹配速度上也有所提高;设计出了良好的人机交互界面,未知短信的过滤与识别进程可在开发平台的后台进行观测。给出短信过滤系统的测试结果,并根据这些测试结果对系统进行了分析和评估。关键词:垃圾短信贝叶斯分类黑名单特征向量硕士学位论文摘要
厂—————————————————————————————————————————————一一⋯..:;瑃琧瑃瑃,,,衔甴—篢海南大学硕士学位论文瓾緄甌,阛.,,琭.,琱甶籋瑃.,琧....
绪言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯喙乩砺垩芯俊绦殴讼低车木咛迳杓朴胧迪帧现有短信过滤方式⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.文本分类技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。贝叶斯原理及其描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.铀乇匆端狗掷嗨惴ā朴素贝叶斯分类流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.铀乇匆端狗掷嗄P汀中文分词技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。基于字符串匹配的分词方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小节⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯虚拟机⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯的配置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯开发平台的搭建⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.7⑵⑵教ǖ娜砑G蟆系统架构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..基础功能设计中的关键技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。垃圾短信过滤功能的实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.菘馀渲谩系统开发时所用到的其它关键技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯