1 / 12
文档名称:

一种改进KMP算法在不良网站信息过滤中应用.doc

格式:doc   大小:29KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

一种改进KMP算法在不良网站信息过滤中应用.doc

上传人:scuzhrouh 2020/8/2 文件大小:29 KB

下载得到文件列表

一种改进KMP算法在不良网站信息过滤中应用.doc

文档介绍

文档介绍:,蒋品群,何婷婷(广西师范大学电子工程学院,广西桂林541004)摘要:针对网络信息过滤的特点和现实中A~4r]对网络信息纯净度的要求,提出了一种基于KMP字符串匹配算法,,对1【)(]组非法网站进行过滤,得出对不良信息过滤查准率达到95,查全率达到98,通过对测试数据的分析和网络吞吐量的测试结果表明,:信息过滤;KMP算法;模式匹配;网络吞吐量中图分类号:-34;TP311文献标识码:A文章编号:l004—373X(2012)01,Ol1OO3ApplicationofanimprovedKMPalgorithminbadwebsiteinformationfilteringDANGHong———ting(CollegeofElectronicEngineering,OuangxiNormalUniversity,Guilin541004,China)Abstract:workinformationinreality,3KMP(Kunth-Morris—Pratt),:informationfiltering;KMPalgorithm;workthroughput0引言1KMP算法及改进策略随着网络的日益普及和网络信息总量的激增,当人们正享受网络技术带给我们美好生活的同时,也使某些不法分子通过网络传送一些不健康的非法信息,因此,,信息过载,信息污染的问题正严重的困扰着用户,,主要采用的方法有分级法,URL地址列表法和动态文本分析法,同时包过滤作为一种能选取用户需要的信息,,而包过滤技术口的核心算法是字符串匹配算法,,较为有效的匹配算法有BF算法,KMP算法,BMH算法,,KMP算法虽然提出时间较早,但由于其可扩展性和易用性,:,,建立用户需求模型,然后在相应的文本流中搜索符合用户需求的文本,再利用反馈,,用户需求模板的构建,信息的揭示,,全自动的信息过滤系统还处于试验阶段,为了提高实用性,往往会在这些关键部分进行必要第1期党红云等:一种改进的KMP算法在不良网站信息过滤中的应用111的人工干预,把人工智能和机器学****的方法引入到信息过滤中,通过遗传算法,神经网络方法,K最近相邻方法(KNN)和支持向量机(SVM)等方法,来判断用户信息需求与文档的相似性,动态地反馈用户需求的变化,,,找出T中的字符串在主串S中的所有出现,如在文本S中查找到一个与模式串T相同的字符串,则模式串与文本匹配;如在文本T中未查找到一个与模式串S相同的字符串,