1 / 80
文档名称:

搜索引擎.ppt

格式:ppt   大小:5,028KB   页数:80页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎.ppt

上传人:baba 2022/10/15 文件大小:4.91 MB

下载得到文件列表

搜索引擎.ppt

文档介绍

文档介绍:该【搜索引擎 】是由【baba】上传分享,文档一共【80】页,该文档可以免费在线阅读,需要了解更多关于【搜索引擎 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。一、搜寻引擎
二、百度搜寻引擎
三、Google搜寻引擎
搜寻引擎
一、搜寻引擎
定义:是基于WWW的信息处理系统,是对网络资源进行标引和检索的工具。实质上是用来对网络信息资源管理和检索的一系列软件。
组成部分
负责工作
搜索器
负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页
索引器
把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中
检索器
面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户
类型:按工作方式区分:主题、书目和多元。
(1)主题引擎
主题引擎工作原理
收集①
处理②
查询③
依据结果由用户访问④
主题引擎:依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(Crawlers)”的软件,以某种策略自动地在互联网中搜集和发觉信息,由索引器为搜集到的信息建立索引,由检索器依据用户输入的“检索词”在索引库中查询,并将查询结果返回给用户。
服务方式:面对网页的全文检索服务 程序自动完成,处理信息的层次是网页。
优点:信息量大、更新刚好
缺点:返回信息中常有很多无关信息,甚至有确定比例的死链接,用户必需从结果中进行筛选。
国内代表:百度(://baidu)等
国外代表:Google(://google)等
它们的首页都只有一个检索文本框。
主题引擎
(2)书目引擎
搜索引擎
主题引擎
目录引擎
是否人工参与

程序自动完成

提供的结果
网页
网站
适合
专指、具体
某一专题
以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面对网站,供应书目阅读服务和干脆检索服务。
国内代表:搜狐、新浪、网易、雅虎中国的分类书目。以及网上的一些导航站点、网址之家。
国外代表:YahooDirectory(网站数量约200万个)等。
书目引擎
(3)多元引擎
供应各个主题引擎的统一检索平台。
一般没有自己网络机器人及数据库,而是将用户的查询恳求通过调用、限制和优化其它多个独立搜寻引擎的搜寻结果(网页)并以统一的格式在同一界面集中显示。
优点:返回结果的信息量更大、更全。
缺点:不能够充分运用所运用搜寻引擎的功能,用户须要做更多的筛选。
国内代表:万维搜寻(://widewaysearch)等。
国外代表:元搜寻metacrawler(://metacrawler)等
多元引擎
同时提交多个独立的搜寻引擎,分别检索多个数据库,并将检索结果进行二次加工,最终将整理好的检索结果输出给用户。
支持调用12个独立搜寻引擎,供应涵盖近20个主题的书目检索服务。
目前,主题引擎与书目引擎有相互融合渗透的趋势。原来一些纯粹的主题搜寻引擎现在也供应书目搜寻,如Google就借用OpenDirectory书目供应分类查询。而Yahoo书目索引则通过与Google等搜寻引擎合作扩大搜寻范围。
在默认搜寻模式下,一些书目类搜寻引擎首先返回的是自己书目中匹配的网站,如搜狐、新浪、网易等;而另外一些则默认的是网页搜寻,如Yahoo。