1 / 15
文档名称:

信息检索技术方法及搜索引擎.doc

格式:doc   大小:38KB   页数:15页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

信息检索技术方法及搜索引擎.doc

上传人:drp539607 2019/3/26 文件大小:38 KB

下载得到文件列表

信息检索技术方法及搜索引擎.doc

文档介绍

文档介绍:信息检索技术方法及搜索引擎第一节::逻辑与(AND),逻辑或(OR),逻辑非(NOT)1布尔逻辑检索技术逻辑与逻辑乘:"and"或"*"表示组配方式:A*B或者AandB表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,:"or","+"组配方式:AORB或者A+B,表示检索含有A词,或含有B词,或同时包含A,:放宽提问范围,增加检索结果,起扩检作用,:"not""-"组配方式:A-B,:逻辑非用于排除不希望出现的检索词,它和"*"的作用相似,能够缩小命中文献范围,:"打印机驱动程序"查询关键词:打印机,驱动程序检索表达式:打印机AND驱动程序例如检索:"微型计算机"方面的有关信息查询关键词:微型计算机,微机检索表达式:微型计算机OR微机布尔逻辑检索举例布尔运算符优先级比较有括号时:括号内的先执行;无括号时:NOT>AND>OR例:检索"唐宋诗歌":唐,宋,诗歌;检索表达式:(唐OR宋)AND诗歌;唐AND诗歌OR宋AND诗歌;错误表达式:唐OR宋AND诗歌;唐AND宋AND诗歌;唐OR宋OR诗歌;唐AND宋OR诗歌;布尔逻辑运算符优先级请注意在不同的数据库中,所使用的逻辑符号可能是不同的,有的用"and,or,not"有的用"*,+,-".一些检索工具会完全省略任何符号和关系,"〕,,,-"(即空格,逗号,减号):是指在检索式中用专门的符号(截词符号):主要是提高查全率截词符一般用""或"*"表示2截词检索技术截词位置按截词位置可分为前截词,后截词,前后截词和中间截词;按截断字符数的不同,,又称后截词,*,*n,检索到woman,,defen*,又称前截词,后方一致,允许检索词前有若干变化,例如*physics就可检索到physics,astrophysics,biophysics,chemophysics,:词干的前后各有一个截词符,,puter,puters,puter,,所使用的截词符号没有统一的标准,有的用"",有的用"*",有的用"#",用的用"$"""和"*",一般是指右截词,部分支持中间截词,,一般用"*"代表一个字符串,用"","生物防治"的文献,若用检索式"biological*control"检索,则会将"抑制生物"(controlbiological)的文献也查出来,(W),(nW),(N),(nN),句子位置算符(S),字段算符(F).3邻近检索技术(W)算符(W)是with(word)的缩写,表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,(W)control相当于检索biologicalcontrolCD(W)ROM相当于检索CDROM或CD-ROM.(nW)算符(nW)是nwords的缩写,表示此算符两侧的检索词之间允许插入最多n个词,(1W)material相当于检索wearmaterials,wearofmaterials等.(N)算符(N)是near的缩写,表示此算符两侧的检索词必须紧密相连,词序可变,词间不允许插入其他词或字母,(N)retrieval可检出:informatio