文档介绍:网络搜索引擎思考
一、搜索引擎的分类
目前,主流的搜索引擎有如下几类:
(一)全文索引
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robo网络搜索引擎思考
一、搜索引擎的分类
目前,主流的搜索引擎有如下几类:
(一)全文索引
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
(二)目录索引
目录索引虽然有搜索功能,但不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词进行查询。目录索引中最具代表性的是Yahoo、新浪分类目录搜索。
(三)元搜索引擎
元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile等。中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
二、搜索引擎概述
搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。它主要是用于检索网站、网址、文献信息等内容。随着网络技术的发展,各种搜索引擎层出不穷,目前流行的搜索引擎主要是帮助用户搜索表层信息,如google、百度、雅虎等。
三、搜索引擎使用技巧
(一)关键词的选择
目前搜索引擎不具备智能识别能力,较人脑而言还很“弱智”,往往不能很好地把握用户到底想要什么,只会在现成的数据库索引中查找相匹配的关键词。因此,选择合适的关键词是成功检索的第一步。关键词的选择虽然没有什么定式,不过也有一些规律可循,在提取关键词时力求做到规范,避免口语化,便能达到事半功倍的效果。此处用特殊实例来说明:
1.使用特定词汇。有时输入的关键词由于过泛而没有被收录在搜索引擎的数据库索引中,这时可以选择与该主题相关且更具体的词汇。例如,欲搜索某些期刊的投稿电子信箱,一般策略是在搜索框内输入“xxx杂志编辑部”,对知名度高、信息化程度高的期刊而言,一般都能搜出相应的email,可信息化程度不高的期刊就比较难。此时可以尝试如下两种方法提高搜索效率:(1)同时输入两个关键词,缩小检索范围,即“xxx杂志email”或“xxx杂志电子信箱”;(2)关键词中加入电子信箱关键信息,即“xxx杂志@”。因为任何电子信箱中均有“@”,“@”成了查找电子信箱的关键符号。通过这两种方法,很容易就能将期刊编辑部的电子信箱搜到。
2.使用多个含义相近的关键词。对于热门信息来说,搜索时犯愁的是返回条目太多,可对冷门事件或事物来说往往恰恰相反。此时可使用同义关键词和关联关键词来检索,以达到更全面的搜索结果。如:在学术部门的年轻人想查阅申报课题的技巧时会发现相关结果少,此时可用“报课题技巧”、“报项目技巧”、“课题申报经验”、“课题