文档介绍:姥棠印奄大警硕士研究生学位论文基±堑拯奎笠的内空过速槿型超过生塞理题目:虹控盐盐差扭型堂皇堇盎垂搓武盐篡扭抖堂皇撞查保密期限:学号:姓名:专业:师:院:年月日密级:导
基于领域本体的内容过滤模型设计与实现将本体知识库与信息过滤系统相结合,建立广告领域的本体库,词、句法分析、知识库查询等步骤。本文提出的知识库系统,以分词,句法分析的结果为基础,进行词的提取,同时结合知识库,推理类层摘要当今,信息技术飞速发展,日常使用的无线信息业务,产生垃圾信息的机会越来越多。如何根据需要对这些信息进行自动分类过滤,就成为信息技术领域的热门问题。在这方面的中文过滤技术研究就成为本文的重点。本论文主要描述以短消息过滤系统为实例,结合领域本体,推理技术完成基于领域本体的内容过滤原型系统。主要做的工作有:收集大量关于广告领域的知识信息,总结归纳得出详细的广告分类和商品分类信息。主要借鉴了官方的商品分类表,还有搜集到的广告类型。由于自然语言描述的不清晰,必须整理、分析这些知识,得出一个明确的广泛的广告领域知识库完成建立广告领域本体的工作,在收集到的领域中的知识中,进行整理抽象,建立广告领域本体。它提供过滤系统重要的信息基础和关联基础。同时通过完善可以应用于短消息过滤系统当中。.利用建立的知识本体库的概念集合,从目标文本样本中匹配分词,以及与其有关的内容。这里建立了分词字典查询机制,从两种词库中分别匹配单词,着重进行基本词库查询匹配处理,产生推理逻辑条件集合。提出基于知识库的查询推理模式,通过一阶逻辑运算,得出精确广告概念分类,并且通过此分类概念给内容体确定性质。基于此精确概念分类,完成过滤系统最终结果的判断。建立内容过滤实验系统模型,其中提出一种知识反馈方式,对过滤系统中过滤消息进行基本分类,并且存储到反馈知识数据库中,提供领域专家知识素材。文中还对对领域本体其他一些应用进行了研究。形成需要的过滤条件,在分词的基础上,使用知识库的推理查询,最终能够识别出需要过滤的文本样本。从目标文本样识别的过程有分次关系得出相近类,应用到基于本体的短消息过滤系统中,就可以使基于领域举体的内容过滤模型的设计与实现一
——堕主丝墨——————————————~。本文还给出了模型系统的发计与实现过程,并且做出了性能分析。从实际中验证理论,总结其中存在问题和今后工作。关键词:语义网领域本体知识库分词推理
“騤閏鴒鷗百伊瑁瓾瞖昭髆卸黣.,印阻基于领域本体的内容过滤模型的设计与实现,畐.,,甎瓼琧...緉,.瑆,鮨抽,瓼瑆“.,,甌.,硕士论文琲
锄,啪硼∞,筶.:孵顿士论文基于领域本体的内容过滤模型的设计与实现,Ⅱ,,,甀樱琣王弘,
盔亟盘Ⅻ叁:墨£耗ǎ豪丝:≥:≥阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论埽Γ喝焊独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:日期:关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借文注释:本学位论文不属于保密范围,适用本授权书。本人签名导师签名基于领域本体的内容过滤模型的设计与实现硕士论文
第一章绪论论文选题的背景部结构进行检查,根据用户设定的不受欢迎信息来源,自动将信息屏蔽,但由于法针对短信息的内容进行过滤,一般常用关键词匹配的方法,对信息进行检索,词不能作为区别过滤的条件;此外由于自然语言中词的多义性和同义性,使这种方法它存在固有的局限性。因此,本文希望结合无线信息内容的特点,在基于语将需要过滤的信息内容建立内在联系,在进行语义分析过程中,将领域本体中概念的属性作为推理条件,搜索信息内容相关概念作为推理条件集合;语义分析时对概念属性集合,基于知识库去推理出相关概念,并根绝相关概念判断其需要过滤的必要程度,正常信息予以转发,非法信息则直接屏蔽,还引入信息有效性的本论文是作者参加“智能通信软件与多媒体北京市重点实验室预研基金项当今,信息技术飞速发展,不仅网