1 / 65
文档名称:

计算机搜索引擎.ppt

格式:ppt   大小:945KB   页数:65页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

计算机搜索引擎.ppt

上传人:xunlai783 2018/1/2 文件大小:945 KB

下载得到文件列表

计算机搜索引擎.ppt

相关文档

文档介绍

文档介绍:计算机搜索引擎
※ 1 搜索引擎概述
※ 2 百度网站及其搜索引擎
※ 3 Google网站及其搜索引擎
※ 4 Yahoo!网站及其搜索引擎
※ 5 Sohu网站及其搜索引擎
※ 6 Dogpile
※ 7 其他
1 搜索引擎概述
§ 搜索引擎的含义
§ 搜索引擎的产生及其发展趋势
§ 搜索引擎的工作原理
§ 搜索引擎的类型
搜索引擎的含义
搜索引擎(Search Engine)是互联网上专门用于信息搜集、信息组织和信息检索的一种工具,是为用户提供“检索”网络信息资源服务的网站。它是以术为基础,对网络上的信息资源进行搜集、过滤、组织,然后给用户提供检索的在线检索工具。搜索引擎的重要功能是能够对互联网上的文本信息提供全文检索。

现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学Alan Emtage等三名学生发明的Archie。Archie的工作原理是依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。
1994年1月,美国德克萨斯大学推出了第一个可供检索的网络分类目录,除了网站搜索外,搜索。。同年4月,斯坦福(Stanford)大学的两名博士生,美籍华人杨致远(Gerry Yang)和David Filo共同创办了超级目录索引Yahoo!。

最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年年底,Infoseek也在国际互联网上亮相,搜索引擎进入了高速发展时期。
1995年Washington大学硕士生Eric Selberg和教师Oren Etzioni开发出了Metacrawler。这是一种新的搜索引擎形式—元搜索引擎(A Meta Search Engine Roundup)。1995年12月DEC公司推出了AltaVista,这是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法(如逻辑运算符AND、 OR、NOT等)的搜索引擎。

上提供服务。1998年2月爱特信公司推出搜狐网站。1998年9月7日目前最流行的搜索引擎之一Google宣布诞生。1998年12月1日新浪网宣告建成启动。2000年9月中国最大的开放式搜索引擎由网易公司推出。2001年10月百度搜索引擎正式公布,它支持多媒体信息和网页信息的搜索,是目前全球最大的中文搜索引擎。
搜索引擎的工作原理
搜索引擎是互联网上专门用于信息搜集、信息组织和信息检索的一种工具。搜索引擎首先对互联网上的网页信息进行搜集,然后对搜集来的信息进行组织,即对搜集来的网页进行预处理,建立网页索引库,实时响应用户的查询请求,最后建立检索机制,对查找到的结果按某种规则进行排序后返回给用户。搜索引擎通过客户端程序接收来自用户的检索请求,现在最常见的客户端程序就是浏览器,实际上它也可以是一个用户开发的简单得多的网络应用程序。一个搜索引擎由搜索器、索引器、检索器和用户接口等几个部分组成。
搜索引擎的工作原理
搜索引擎的工作原理一般包括三部分:数据采集机制、数据组织机制和用户检索机制。
数据采集机制是:利用搜索器对网络上的各种信息资源进行采集,并将采集到的网站信息和网页信息存储到临时数据库中。
数据组织机制是:采用索引器对临时数据库中的信息进行标引、排序等,整理后形成各种倒排文档,并相应地建立索引数据库。
用户检索机制是:利用检索器和用户接口提供给用户检索界面,受理用户提交的检索请求,并根据检索要求访问相应的索引数据库,然后将符合检索要求的结果按一定的规则排序后返回给用户。
搜索引擎的类型
搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full-Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
搜索引擎的类型

全文搜索引擎的原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询,当用户检索时按一定的排列顺序将结果返回给用户,国外具代表性的有Google、Fast/AllTheWeb、AltaVista等,国内著名的有百度。

最近更新