文档介绍:互联网应用模式
------------------常用搜索引擎
市场营销41341
1
搜索引擎发展历史
所有搜索引擎的祖先,是1990年由Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的Archie(Archie FAQ)。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。 由于Archie深受欢迎,受其启发,Nevada puting Services大学于1993年开一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
2
第一代:分类目录时代(人工时代)
不知道大家时候在自己的搜索引擎首页是否有设置过导航网站这个网址作为自己的首页呢?其实这个网址就是搜索引擎第一代的代表。我们可以从这个导航网站这个网站里面看到,里面几乎都是一些分类网址,几乎在互联网上的,这个网站里面都一应俱全,从这里我们可以看出,这个网站是一个导航网站,也可以说分类目录网站,用户可以从这个分类目录里找到自己想要的东西,这就是搜索引擎第一代。
3
第二代:文本检索时代(海量自动获取与排序清单)
到了这一代,搜索引擎查询信息的方法则是通过用户所输入的查询信息提交给服务器,服务器通过查阅,返回给用户一些相关程度高的信息。这代的搜索引擎的信息检索模型主要包括例如布尔模型、概率模型或者向量空间模型。通过这些模型来计算用户输入的查询信息是否与网页内容相关程度高低,将相关度高的则返回给用户。采取这种模式的搜索引擎主要是一些早期的搜索引擎,例如像Alta Vista、Excite等等。这就是搜索引擎第二代。
4
第三代:整合分析时代(立体搜索与结果整合)
这一代的搜索引擎所使用的方法大概是和我们今天的网站的外部链接形式基本相同,在当时,外部链接代表的是一种推荐的含义,通过每个网站的推荐链接的数量来判断一个网站的流行性和重要性。然后搜索引擎再结合网页内容的重要性来和相似程度来改善用户搜索的信息质量。
5
第四代:用户中心时代(以移动互联网为标志的个人需求精准搜索)
第四代,也就是我们所用的搜索引擎技术也是互联网上面用的最普遍的。主要是以用户为中心。当客户输入查询的请求时候,同一个查询的请求关键词在用户的背后可能是不同查询要求。这一代搜索引擎主要是以用户为中心。这就是第四代搜索引擎。
6
网络信息资源检索方法
(1)直接浏览
用户使用最为广泛,最原始的获取信息的方法。
(2)利用导航网站、门户网站
基于专业人员对网络信息资源分布的了解,对
网络信息进行评价、组织、分类等工作,再按一
定的专业或学科形成具有良好分类体系的网络资
源指南。
7
搜索引擎的概念及工作原理
概念:(Search Engine)从广义上讲是用来对网络信息资源管理和检索的一系列软件,网上查找信息的工具或系统。
组成:序(如spider、crawler、robot),索引数据库(包括成千上万甚至上亿个网页),检索程序(用来处理用户的检索请求)
8
研究目的与意义
9
常用搜索引擎介绍及示例
《Google》(中文)
网址:
10