1 / 42
文档名称:

搜索引擎.ppt

格式:ppt   大小:3,316KB   页数:42页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎.ppt

上传人:liangwei2201 2020/5/18 文件大小:3.24 MB

下载得到文件列表

搜索引擎.ppt

相关文档

文档介绍

文档介绍:网络搜索引擎网络搜索引擎的基本概念常用的几种中、英文搜索引擎搜索引擎检索实例1第一节概述搜索引擎简介搜索引擎的工作原理搜索引擎的工作过程搜索引擎的分类2搜索引擎简介搜索引擎的英译名为SearchEngine,是收录网页全文索引的数据库。当使用搜索引擎时,实际上是在检索这些被搜索到的网页的数据库,而不是检索网络本身。3搜索引擎的构成搜索程序搜索引擎的数据库标引程序和索引检索引擎HTML界面搜索程序(crawlers、spiders):识别搜索引擎上的新的网站;识别已经覆盖但有变化的网站。搜索程序收集来自网站的网页内容的信息,并将该信息送给搜索引擎的数据库。有许多搜索引擎,在搜索网站时,总是更为全面和经常地搜索常用的网站(例如用户经常点击和带有许多链接的网站),对不常用的网站则不屑一顾。搜索程序对搜索的深度、广度或者二者均做了限定。在深度上,不仅搜索主页,而且还搜索那些网页的附属网页。在广度上,只是搜索更多的网页,而不去搜索网站的附属网页。搜索引擎的数据库全部单个网页储存信息的集合构成了搜索引擎的数据库。数据库中不仅包括被搜索程序搜索到的网页,而且还越来越多地包括被其他资源和技术搜索到的网页。我们在使用搜索引擎时,不是直接在检索网站,而是在检索一个数据库,它包含了描述网站上一部分网页的记录。记住它,可以帮助我们避免对搜索引擎实际功能期望过高!标引程序标引程序检查数据库中储存的信息,并在索引中列出合适的款目。在输入提问式后,正是使用这个索引来识别匹配的记录的。搜索引擎只是把认为是单词的进行了标引。有些搜索引擎列出了一个禁用词表,对这些词不加标引;有些搜索引擎不标引冠词和连接词;有些不标引其他高频出现但却有潜在用途的词,如‘web’和‘’……标引策略的不同,会影响到检索结果。因此有的网页就在搜索引擎的数据库内,但是就是检索不到。检索引擎检索引擎是一种程序,它接收提问式,然后检索索引,识别并回复与提问式匹配的记录。步骤:(1)检索引擎利用“检索算法”识别被匹配的记录;(2)然后采用特殊的排序方式对检出的款目进行排序,显示给用户。HTML界面在用户连接到一个搜索引擎后,所看到的是HTML界面。该界面收集用户的提问式数据,并将这些数据送给搜索引擎进行检索。它最为明显的功能,是为用户提供规定提问的手段。然而,这个界面还起到另外几种作用,包括为广告商提供广告空间,提供检索各类入口,提供帮助和有关服务的其他信息的链接。4搜索引擎的分类按检索方式的不同可将搜索引擎分成两大类:基于关键词的检索分类目录型的检索5第二节中、搜索引擎就像信息海洋中的导航员,能帮助人们快速找到所需的信息。然而随着各种信息的巨量增长,人们使用搜索引擎也遇到了许多困难,相同的搜索词在不同的搜索引擎中得出不同的结果,在质量和数量上都有所不同。产生这种现象是因为不同的搜索引擎采集信息的方法、标引的内容以及检索功能是有所区别的,下面详细介绍一下各种搜索引擎的特征并对它们进行比较和评析。6中文搜索引擎谷歌中文l//百度国搜索/…………,然后迅速传播到全球的信息搜索者。Google目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问一个包含超过80亿个网址的索引。“Google”来自于数学名词“Googol”,Googol表示一个1后面跟着100个零。。SergeyBrinLarryPagegle技术Google秉持着“完美的搜索引擎需要做到确解用户之意,切返用户之需”的信念,开发了自己的服务基础结构和PageRank™技术,使得搜索方式发生了根本性变化。Google使用PageRank™技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。10