1 / 118
文档名称:

搜索引擎.ppt

格式:ppt   页数:118页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎.ppt

上传人:825790901 2016/1/2 文件大小:0 KB

下载得到文件列表

搜索引擎.ppt

相关文档

文档介绍

文档介绍:搜索引擎我们被信息淹没, 但却渴求知识。——《大趋势》约翰·奈斯比特主要教学内容?搜索引擎概念及其发展历程?搜索引擎的原理简介?搜索引擎的几点使用说明?Google入门到精通?其他搜索引擎简介搜索引擎的发展历程因特网是世界上最大的信息宝库,它已成为全球范围内传播和交流科研信息、教育信息、商业信息和社会信息的最主要的渠道,要想在这一浩瀚无边、变化多端而又鱼龙混杂的信息海洋中发现并查找出有利用价值的信息并不是一件易事,犹如大海捞针。为了有效的利用这些资源,大量的搜索引擎便出现了。搜索引擎的概念所谓搜索引擎,是指询服务的一种信息服务系统。它们主要通过网络搜索软件(又称网络搜索机器人)或多种人工方式,将,经过加工处理建成索引数据库或目录指南,从而能够对用户提出的各种查询请求做出响应,并提供用户所需要的信息。搜索引擎的发展历程搜索引擎的发展历程搜索引擎的雏形?。?虽然当时万维网还未得到全面的推广,但还是经常需要在网络中传输大量的文件,由于这些文件大多散布在分散的FTP主机中,查询起来非常不便,,于是便有了Archie。?Archie工作原理与现在的搜索引擎很相似,它依靠脚本程序自动搜索网上共享的文件,然后对相关信息进行索引,以供使用者查询。?不过此时的搜索工具还只限于文件索引功能,随后出现的一些类似于Archie的搜索工具中就加入了检索网页的功能。搜索引擎发展历程?蜘蛛程序的由来?当时,电脑“机器人”一词可是非常流行,它指的是某个能够以人类无法达到的速度不间断地执行某种任务的软件程序。?由于专门用于检索网络信息的“机器人”程序像蜘蛛一样在网络间爬来爬去,因此,搜索引擎中的“机器人”程序就被称为“蜘蛛”程序。?世界上第一个用于监测互联网发展规模的“机器人” Wide Web Wanderer(四W)。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。?与杰瑞的Wanderer程序相对应,,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是依靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo等网站。?第一个搜索引擎?第一个真正意义上的现代搜索引擎出现在1994年7月。当年4月,美国斯坦福大学的两名博士生,(/guiren/?newsid=16651)共同创办了大家熟知的超级目录索引Yahoo,从此搜索引擎进入了高速发展的时期。?目前,互联网上大大小小的搜索引擎已达千余家,其检索的信息量也与从前不可同日而语。随着互联网规模和信息量的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。它本身可能并不是直接面向用户的搜索引擎,但向其他搜索引擎提供全文网页搜索服务。从这个意义上来说,它们是搜索引擎的搜索引擎。搜索引擎的原理简介?作为处于用户层和可以把独立搜索引擎看成是一个双层的客户机/服务器(Client/Server----C/S)结构体系:当用户访问搜索引擎时,用户端为客户机,向搜索引擎发出检索请求,搜索引擎为服务器,检索自己的索引数据库并将检索结果以应答形式提交给用户;当搜索引擎采集数据时,搜索引擎为客户机,向统为服务器,将有关数据(例如W W W页面或文档)作为应答提交给搜索引擎。搜索引擎的原理简介?机器人搜索引擎?机器人搜索引擎的自动信息搜集功能一般通过两种方式实现:一种是定期搜索,即搜索引擎定期主动派出“蜘蛛”程序,对一定IP地址范围内的网站进行检索,一旦发现更新或新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即由网站所有者主动向搜索引擎提交网址,然后搜索引擎在一定时间内专门向该网站派出“蜘蛛”程序,扫描并将有关信息存入数据库, 以备用户查询。?当用户使用搜索服务时,搜索引擎在数据库中搜寻用户输入的关键词,如果找到与用户要求内容相符的网站,便采用特殊的算法计算出各网页的信息关联程度、比如说网页中关键词的匹配程度、出现的位置/频率等,然后根据关联程度高低,按顺序将这些网页链接制成索引返回给用户。