文档介绍:河北大学
硕士学位论文
基于本体的智能信息检索研究
姓名:张明
申请学位级别:硕士
专业:计算机应用技术
指导教师:袁方
20071201
摘要随着计算机技术和的迅猛发展,全球信息化时代已经到来,各类信息急剧增长。在传统的信息检索方式下,由于信息资源缺少统一的语义描述,用户越来越难以找到与要求相关的信息。如何使检索具有智能化,并且提高检索的效率以达到提高信息资源利用率的目的,是信息检索领域所面临的挑战。本体的概念最初起源于哲学领域,如今在计算机的许多领域得到了广泛的应用。领域本体是对某领域中的概念和关系的描述,借此使计算机能够了解被检索资源的语义信息,促进知识共享。本文通过对传统信息检索的基本原理、信息检索的分类、信息检索发展现状和传统信息检索方式存在的问题等方面的分析研究,结合本体的特点,提出了基于本体的智能信息检索体系框架,并详细描述了智能信息检索系统的设计思想和系统框架模型。本文同时对智能信息检索系统中所采用的关键技术进行了深入的分析研究,为智能检索的实验奠定了良好的基础,这些关键技术主要包括:领域本体的构造、数据存储、语义推理和检索结果的排序等。在理论分析的基础上,进行了智能信息检索系统的实验,开发了基于本体的智能文献检索实验系统,系统以计算机领域的论文为检索对象,构造了相应的领域本体一一文献本体和计算机领域语义词典本体,从而解决了检索中缺乏语义信息的问题,使检索智能化,相对于传统的基于关键词的检索方式提高了查全率、查准率和语义相关率。关键词智能信息检索本体语义检索
,琣,瑃篒,;瓾琩畉瑆瓺甀琾瑃.,甌瑂.~瑃瑆籓籗
导师签名:—表乒一日期:丑年旦月土日日期:珥年卫月上日趣晡涝隆!H丛亟⒈C芸冢凇!D辍!T隆!H战饷芎笫视帽臼谌ㄉ鳌呈盛堑丛河北大学学位论文原创性声明学位论文使用授权声明作者签名:日期:所呈交的学位论文,是本人在导师指导下进行的研究工作及取得除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得河北大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。本人完全了解河北大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。朐谝陨舷嘤Ψ礁衲诖颉啊獭本人郑重声明:的研究成果。尽我所知,本学位论文属于⒉槐C芸凇~
⒓焖随着计算机技术和技术的发展,人们能更快地在全球范围内发布和共享信息,这使得信息资源极为丰富。据国务院信息化工作办公室统计,截至到年月日,全国域名数为,觯晖谙啾仍龀%。我国网上资源增长更加迅速,%。网页字节总数为,年内增长,【俊D苡行У幕袢⌒畔⒆试匆殉晌M贫缁岱⒄购推笠到降闹匾Aα俊5息的急剧增长,使得获取准确的信息变得困难,人们发现在如此庞大的信息海洋中,找到有价值的自己需要的信息并不是很容易的一件事。因此,如何迅速、高效地检索和访问各领域的信息资源以促进信息交流与共享便成了一个急需解决的重要问题。准确、高效的信息检索工具,尤其是闲畔⒌募焖鞴ぞ撸晌A巳嗣瞧惹械男枰#饧ù笸动了信息检索技术的发展。信息检索琁是指从信息集合中查找出所需信息的程序和方法。信息集合是指有组织的文献整体,它可以是数据库的全部记录,还可以是某个文献收藏单位收藏的全部文献,当然也可以是某个单位通过发布的各类信息集合【俊P畔⒓焖髌鹪从谕际楣莸牟慰甲裳臀恼<焖鞴ぷ鳎兰拖掳胍犊J挤⒄梗至世纪年代,索引和检索已成为图书馆独立的工具和用户服务项目。‘从发展阶段上来看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个阶段。信息检索存在广义和狭义之分,广义的信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。狭义的信息检索则仅指从信息集合中找出所需信息的过程,仅指广义信息检索中的检索部分,相当于人们常说的信息查询。同时信息按表现形式上的划分可以分.
如搜索引擎,对网络上的信息进行在线搜索,检索对象是各种在线信息。为:文本信息、图像信息、数值数据信息、语音信息。虽然信息有多种表现形式,但是文本还是我们最常用也是最简洁、最抽象的信息表现,所以我们主要研究文本信息的检索,文本信息检索的关键是文本信息的索引和检索。畔⒓焖鞯幕驹信息检索技术帮助人们从浩瀚的信息中检索出对用户有用的信息,节省了用户大量的时间。网络信息检索是指对上发布的信息进行检索,目前主要的检索手段是使用搜索引擎。调查数据显示,目前有。サ娜司J褂盟阉饕妫悄壳敖龃于电子邮件的网