1 / 5
文档名称:

互联网上的搜索引擎.doc

格式:doc   大小:25KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

互联网上的搜索引擎.doc

上传人:lxydx 2016/8/11 文件大小:25 KB

下载得到文件列表

互联网上的搜索引擎.doc

文档介绍

文档介绍:互联网上的搜索引擎[摘要] 本文对搜索引擎的历史、分类和发展进行了介绍。概述了搜索引擎发展的演进过程, 介绍了当前业界主要的搜索引擎的类别: 全文搜索、目录和元。并展望未来搜索引擎的发展趋势。着重介绍了当今优秀搜索引擎站点。[ 关键词] 搜索引擎目录元搜索引擎站点中图分类号: s-01 文献标识码: A 文章编号: 1009-914X ( 2016 ) 01-0157-01 一、引言在互联网发展初期, 网站相对较少, 信息查找比较容易。然而伴随互联网爆炸性的发展, 人们很难准确地找到所需的信息。而使用搜索引擎则可解决这一问题。搜索引擎( Search Engines )意为信息查找的发动机,它以一定的方式在 中帮助用户查询信息,并返回相应的查询结果信息的技术和系统, 是互联网上的可以查询网站或网页信息的工具。它包括信息搜集、信息整理和用户查询三部分。搜索引擎是互联网的第二大核心技术, 涉及到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术。二. 搜索引擎的发展史搜索引擎发展至今, 大致经历了分类目录时代( 人工时代) 编辑(第一代)、文本检索时代( 海量自动获取与排序清单) 编辑( 第二代)、第三代:整合分析时代(立体搜索与结果整合)编辑(第三代) 、用户中心时代(以移动互联网为标志的个人需求精准搜索)编辑(第四代) 、生活生态圈搜索时代(以物联网为标志的实体搜索)编辑(第五代)五个阶段。三. 搜索引擎分类介绍根据搜索引擎提取数据的方法,可将搜索引擎系统可以分为三大类, 分别是全文搜索引擎( Full Text Search Engine ) 、目录索引类搜索引擎( Search Index/Directory )和元搜索引擎( Meta Search Engine )。 1. 全文搜索引擎全文搜索引擎是一种纯技术型的搜索引擎。如 google 、 AltaVista 、 Inktomi 等,其原理是通过机器手(即 Spider 程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。 2. 目录索引类搜索引擎目录索引是一种网站级搜索引擎, 它虽然有搜索功能, 但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词( Keywords ) 查询, 仅靠分类目录也可找到需要的信息。 Yahoo 就是这类搜索引擎的代表。 3. 元搜索引擎这类搜索引擎没有自己的数据, 而是将用户的查询请求同时向多个预先选定的独立搜索引擎递交, 将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。 4 、其他搜索引擎但是,也有一些搜索引擎的操作方式不同于上述类型的搜索引擎: (1 )集成搜索引擎:它的原理则相当简单,甚至不需要多少专门的核心技术,其表现形式是:在一个浏览界面上同时链接了多个搜索引擎, 用户检索时可以选择其中的部分或者全部搜索引擎,一次输入关键词,可以获得多个搜索引擎的检索结果。因此这种形式实际上并不是独立的搜索引擎,应该说是对现有搜索引擎的一种应用方式。(2 )门户搜索引擎:如 AOL Search 、 MSN Search 等虽然提供搜索服务, 但自身即没有分类目录也没有网页数据库, 其搜索结果完全来自其他引擎。(3 )免费链接列表