文档介绍:网络数字资源及其检索
主讲:顾文佳
2004年9月
库文档分享
数字信息资源概述
参考数据库
全文数据库
事实数据库
电子图书
电子期刊
电子报纸
搜索引擎/分类指南
网络学术资源学科导航
FTP资源
其他:网站、BBS、新闻组等
库文档分享
库文档分享
检索提问式的定义及类型
概括地说,检索式是检索策略的逻辑表达式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。
布尔逻辑检索式是目前使用最普遍的检索式,即用布尔算符(and、or、not)将检索词组合起来。
位置算符检索式是对布尔逻辑检索式的一种改进,式中不仅有布尔算符,而且有位置算符,用以指明检索词之间的位置关系,从而解决了布尔算符组配检索词时没有词序的问题,进而提高了查准率。
库文档分享
构成检索提问式的5种符号
位置算符:表示所连接的各个单元词词间位置关系的符号,在不同的系统中往往以不同的符号表示。
字段后缀符:限制检索词在数据记录中出现的字段位置,主要是题名、文摘、叙词和标识词字段,分别缩写为TI、AB、DE和ID。通常是在检出的文献量较多的情况下才考虑使用。
限制符:挑选命中文献的文种、文献类型、出版时间和重要文章,约束检索结果。其形式和用法同上。
库文档分享
字段前缀符:其作用与限制符一样,都是表示文献的外部标志,不反映文献的内容,对检索式的命中文献从非主题方面加以限制。
截词符:其作用是在保证关键词检索的前提下,扩大检索范围。
除了以上5种符号外,构造检索式还常常用到括号。括号可以规定运算的优先次序。
一般说来,使用布尔算符、括号、截词符和位置算符,就可以构造出一个比较完善、切题的检索式了。
库文档分享
数字信息资源概述:检索技术
布尔逻辑检索
库文档分享
布尔逻辑检索
逻辑“与”(and):检索时,命中信息同时含有两个概念,专指性强;
逻辑“或”(or):检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比and扩大。
逻辑“非”(not):命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词。
逻辑“异或”(xor):命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。
布尔逻辑检索:运用布尔逻辑算符(Boolean operators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。
库文档分享
布尔逻辑检索(续)
注意:
在不同的检索系统里,布尔逻辑的运算次序是不同的,因此会导致检索结果的不同。通常运算次序有这样几种形式:
一是按算符出现的顺序,如果是and、or、not,就按and、or、not的顺序运算;如果是or、not、and,就按or、not、and的顺序运算;
二是默认and优先运算,其次是or、not;
三是默认or优先运算,然后是and、not。一般来讲,检索系统的“帮助”文件中都会有这类说明,只要注意查看即可。
在中文数据库里,布尔逻辑运算符有时用and、or、not下拉菜单形式表示,供用户选择;有时用“*”号表示逻辑“与”,用“+”表示逻辑“或”,用“-”表示逻辑“非”。
库文档分享
检索技术
位置算符检索:
即运用位置算符(position operators)表示两个检索词间的位置邻近关系,又叫邻接检索(proximity)。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。
库文档分享