1 / 3
文档名称:

基于Ontology的搜索引擎排序算法的研究.doc

格式:doc   大小:13KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Ontology的搜索引擎排序算法的研究.doc

上传人:凹凸漫 2021/9/29 文件大小:13 KB

下载得到文件列表

基于Ontology的搜索引擎排序算法的研究.doc

相关文档

文档介绍

文档介绍:基于Ontology的搜索引擎排序算法的研究
论文导读:基于本体的智能搜索是基于知识的、语义上的匹配, 在查全率和查准率上有更好的保证。但是面对如此浩瀚的信息,能让用户发现所需要的信息就需要一个好的排序算法来使得用户真正需要的信息能出现在显要位置。因此, 基于本体的搜索排序算法也就成为一个新的研究问题。当为搜索短语选择了具体的域后,我们的搜索器将使用这些短语及本体论来产生搜索概念及为语义搜索产生相关的概念。
关键词:本体,排序算法,搜索,语义
随着Internet 的普及和推广, 人们越来越依赖于互联网络进行各种商务活动和信息查询, 因此网络信息查询已经成为人们研究和讨论的热点领域。现在流行的网络搜索引擎很多, 每一种都有各自的特点。但都存在一个很大的缺陷, 那就是在搜索信息的时候无论从查全率和查准率上都存在一定的不足, 一个主要的原因是现在的搜索引擎都是基于关键词或者基于内容分类目录进行查找的,使得搜索引擎很少具有进一步的智能化,这样就不可避免的出现垃圾信息 【1】 。
近几年, 本体理论的发展和逐步成熟为信息检索技术的发展带来了新的动力, 同时也为提高检索系统的查准率和查全率提供了更好的保证。作为一种有效表现概念层次结构和语义的理论和方法, 本体已经被广泛应用于计算机科学和信息管理领域 【2】 。
基于本体的智能搜索是基于知识的、语义上的匹配, 在查全率和查准率上有更好的保证。但是面对如此浩瀚的信息,能让用户发现所需要的信息就需要一个好的排序算法来使得用户真正需要的信息能出现在显要位置。因此, 基于本体的搜索排序算法也就成为一个新的研究问题。
2本体概念
本体是一个源于哲学的概念, 原意指关于存在及其本质和规律的学说, 后来被计算机科学领域引入, 特指对共享概念模型所作的明确化、形式化、规范化说明, 它强调领域中的本质概念, 也强调这些本质概念之间的关联。
关于本体的概念,其中最著名、被引用最为广泛的定义是由Gruber 提出的: '本体是概念化的明确的规范说明' 【4】 。Studer 对本体诸多定义进行概括分析后认为, 本体论的概念包括四个主要方面 【5】 :
1) 概念化(conceptualization): 客观世界现象的抽象模型, 其表示的含义独立于具体的环境状态。
2) 明确(explicit): 概念及它们之间联系都被精确定义。
3) 形式化(formal): 精确的数学描述,计算机可读。
4) 共享(share): 本体中反映的知识是其使用者共同认可的,是相关领域中公认的概念集, 它所针对的是团体而不是个体。
3基于本体搜索引擎排序算法
图3-1是基于本体智能搜索引擎的搜索过程 【6】 。


在用户输入搜索关键字后,我们的搜索器将在本体库中查询短语,来得到包含关键字的本体论。然后搜索器发送这些可能相关的本体论给用户选择,以避免文本的模糊性,因为不同的领域可能包含相同的短语 【7】 。当为搜索短语选择了具体的域后,我们的搜索器将使用这些短语及本体论来产生搜索概念及为语义搜索产生相关的概念。搜索器将在索引库中为每个关键字短语扫描搜索索引,获取所有概念相关的文档。然后排序器将使用这些文档及本体论来排序及过滤,以获得一组对应于用户查询的排序的文档列表。