文档介绍:上海交通大学
硕士学位论文
基于本体的信息检索方法研究
姓名:秦嘉伟
申请学位级别:硕士
专业:情报学
指导教师:黄敏
20070101
上海交通大学硕士学位论文
基于本体的信息检索方法研究
摘要
近些年来,随着信息技术的快速发展,用户获取信息资源的需求
不断增强。传统的信息检索工具提供给用户的主要是基于关键字的检
索接口,但是在很多情况下用户真正的检索意图很难用几个关键字表
达清楚,这也是导致现有检索系统的精度不高的原因之一。要提高现
有检索系统的精度,就必须将信息检索从目前基于关键词层面提高到
基于知识(或概念)层面,必须基于语义层面组织和表示信息,设计
合理的智能信息检索系统。
本体论是近年来随着计算机信息处理、人工智能、知识工程等学
科的发展而迅速兴起的一个十分具有活力的研究领域。本体作为一种
能在语义和知识层次上描述信息系统的概念模型建模工具,已被广泛
应用于知识工程、系统建模、信息处理、数字图书馆、自然语言理解、
语义Web等领域之中,把本体融合到传统信息检索技术中去,不仅可
以继承概念信息检索的优点,还可以克服概念信息检索不能对概念关
系进行处理的局限性。虽然目前有关本体论的研究还处在雏形阶段,
没有统一的标准和固定的应用领域,但是本体在语义网中的应用研究
I
上海交通大学硕士学位论文
必将成为热点,基于本体的知识检索也必将引起重视。
本论文在研究基于本体的信息检索模型的基础上,力图建立具有
统一标准接口的信息检索系统,强调兼容性、可扩展性。首先,创建
标准界面,在该界面上管理员可以方便地输入、修改本体,并以标准
的文件格式保存,其次在本体数据的基础上实现基于本体的推理,最
后返回推理结果的字符串到应用程序,以满足不同系统的具体需求。
该系统可以无缝地融合到具有传统检索技术的系统中,提高对语义的
支持,改进检索系统的性能,是对基于本体信息检索的一大尝试。
本文研究内容,立足于开发具有兼容性的可扩展的系统,力图在
统一的标准上构建系统,尝试为本体在信息检索系统中的应用开拓新
的思路。但是由于时间等诸多原因,本文研究内容尚处于基础性的阶
段,进一步遵照标准应用本体技术,创建实用、可靠的信息检索系统,
还有待相关研究人员的进一步工作。
关键词:信息检索,本体,Jena,RDF,RDQL
II
上海交通大学硕士学位论文
RESEARCH OF INFORMATION RETRIEVAL BASED ON ONTOLOGY
Abstract
At present, with the rapid development of information
technology, there are more requirements of accessing different
types of information. The traditional tools of information
retrieval can only offer imports based on key words. But most
time only key words can’t express the real demands of the users.
This es one of the reasons which make the retrieval systems
can’t return the accurate results. To advance the information
retrieval system, the transfer from the retrieval technology
based on key words to the new version based on knowledge or
concept should be plished. Intellectualized information
retrieval system and the semantically based way of managing
information should be noticed.
Ontology as the new concept to describe the semantic
hierarchy of knowledge has been widely used in different fields.