1 / 3
文档名称:

搜索引擎技术.docx

格式:docx   大小:12KB   页数:3页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎技术.docx

上传人:baba 2022/6/8 文件大小:12 KB

下载得到文件列表

搜索引擎技术.docx

文档介绍

文档介绍:搜索引擎技术
随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就象大海捞针一样,搜寻引擎技术恰好解决了这一难题。搜寻引擎是指互联网上特地供应检索服务的一类网站,这些站点的服务器通过网络搜寻软件或网络登搜索引擎技术
随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就象大海捞针一样,搜寻引擎技术恰好解决了这一难题。搜寻引擎是指互联网上特地供应检索服务的一类网站,这些站点的服务器通过网络搜寻软件或网络登录等方式,将Intemet 上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,供应用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特别信息的检索。下面以网络搜寻机器人为例来说明搜寻引擎技术。
1.网络机器人技术
网络机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获得Internet上的信息。一般定义为“一个在网络上检索文件且自动跟踪该文件的超文本结构并循环检索被参照的全部文件的软件”。机器人利用主页中的超文本链接遍历WWW,通过U趾引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HIML文件合法性的验证、uRL链接点验证与确认、监控与获得更新信息、站点镜像等。机器人安在网上爬行,因此须要建立一个URL列表来记录访问的轨迹。它运用超文本,指向其他文档的URL是隐藏在文档中,须要从中分析提取URL,机器人一般都用于生成索引数据库。全部WWW的搜寻程序都有如下的工作步骤:
(1)机器人从起始URL列表中取出URL并从网上读取其指向的内容;
(2)从每一个文档中提取某些信息(如关键字)并放入索引数据库中;
(3)从文档中提取指向其他文档的URL,并加入到URL列表中;
(4)重复上述3个步骤,直到再没

最近更新

公共基础知识广西省崇左市选调生考试(行政职.. 147页

公共基础知识江苏省常州市选调生考试(行政职.. 147页

公共基础知识河北省邢台市选调生考试(行政职.. 148页

公共基础知识浙江省衢州市选调生考试(行政职.. 147页

公共基础知识重庆市宜宾市选调生考试(行政职.. 147页

吉林省四平市事业单位招聘考试(职业能力倾向.. 148页

吉林省通化市事业单位招聘考试(职业能力倾向.. 148页

国网中兴限公司2024年第二批高校毕业生招聘约.. 58页

安徽省淮南市事业单位招聘考试(职业能力倾向.. 149页

安徽省阜阳市事业单位招聘考试(职业能力倾向.. 148页

山东省威海市事业单位招聘考试(职业能力倾向.. 148页

平顶山汝州事业单位2024年招聘100人历年高频难.. 58页

昭觉县人力资源和社会保障局2024年公开招聘事.. 60页

江苏省宿迁市事业单位招聘考试(职业能力倾向.. 149页

江西省新余市事业单位招聘考试(职业能力倾向.. 147页

河南三门峡社会管理职业学院三门峡技师学院选.. 59页

浙江理工大学2024事业单位招聘拟聘历年高频难.. 59页

浙江省温州市事业单位招聘考试(职业能力倾向.. 147页

玉溪市华宁县2024年部分事业单位招聘工作人员.. 60页

福建省南平市事业单位招聘考试(职业能力倾向.. 148页

福建省福州市事业单位招聘考试(职业能力倾向.. 146页

辽宁省大连市事业单位招聘考试(职业能力倾向.. 146页

遵义市水利局2024年面向社会公开招聘工作人员.. 60页

长沙市长善垸污水处理厂2024年度公开招聘工作.. 58页

驻马店事业单位2024确山县招聘工作人员历年高.. 59页

2024年职业技能测试题库及参考答案 38页

常用精神科处方集 17页

合同职代会决议、公示范本 10页

银行干部竞聘面试试题及答案 3页

人教版八年级生物结业考试试卷及答案 7页