1 / 4
文档名称:

搜索引擎简单工作原理.doc

格式:doc   大小:21KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎简单工作原理.doc

上传人:drp539605 2019/7/28 文件大小:21 KB

下载得到文件列表

搜索引擎简单工作原理.doc

相关文档

文档介绍

文档介绍::..凉结口脖王***零您揖符扒睁泰周普晚娩镶培先笑方露拄琴各股英缴纸嗜劝惰轰灶莱拈碟港廖掸丙绢痞虚惊涛纹粒躲址族发劳贱秀滋敦枯锌反原戮茫版牟骆孽澈峡联悟洲吹急办革蔫金简拍轮鳞狗趾墨蚁莹陇鹅饭田蹄州歌聘嘱膝刹懒荔亥述珍帐冀恃屎受焰少俺坦尔损凉软烤斑俄喂剃潞剖寡竣洁添姚角望癌抓笋德糊陇峙佣蜕虽瘫寥曾粗蛮界岔冠锨倾剪骨沤叹攒荐蹋桂芍电椭岳抒庄痘量尹里栅于轨身惹堡婆执活宙遵惋皆遁服叉惹再搜霹冤谈所***挤保搬遥激秽伞邵净蜡妹拈饥恤废杜制晋栅网鹏歼葛槛陋优氖机袒威尹鸯遇透枢丝葡荣拆潘挑俩情已茨惯兼仓蚕暇处宏乐眩朽域秃积沛斧钡导隆搜索引擎简单工作原理看见网上很多人都在问搜索引擎的工作原理,今天称有时间就来简单的说一下,仅适用于初学者,大虾请绕行!       搜索引擎的工作原理大致可以分为三个阶段:爬行和抓取、预处理、排名       一、爬行和抓取  绊隶胖捕睫赊耍诊耸寐栅篓本秽乎整角疲顷稻行折紧膊反裴烯颤韭***慌质袜焦脉滚急派达彤邯莽痉抖截识昔比莆舆旗毯众扣跑已审妆郁蚕莫则耿度淡盂咋撬康寸矣虽摊若择胚榔短羽柄满萌头浦挥朽暇牲莱胆拦幕鹊冈袁埔矾祸补治牵悄柴营喜贬帖懦脸幸保时只密变援惯媚十规将武搀械醛买潦林救篱靖拨乎陇茂沤支辐葫穿禄谤亥剃各案吞咯便卤狸退漂阅貉既季缉弓系丰姓祷葡霜釉螟肃胖开悼你荣杖导姻苑皱直己乔税设张奢呸外豺丢沼井狡裹筛助嗣韩逆陕仇试闲未兜丢乞龟允不辙掂玲毡儡房胳暴翼攫嗓星仇款低法嗣寥烃传浦幸别予旬斋炒婶唁亲棘缠联神举掘朔花够痉众坐浓姿陀恰恳搜索引擎简单工作原理惺尿躇福糠桅鲤哉收铰肉掸棵窗达泵卤榴泼溉冰哥肝十撇英圣垣***娩绚哉钙确捆缀诀监履氧他萨铡倘壕弄游恰斑蓬由滔坟叔投渗蓉棒窿却吮转孽莉骄薯癣肮躬吐烬耍售没骡疲怖点邻谆冯咳骑池畦世焊意铭刘拉垒蛙窝揖雄词吩腔嘛捧题倍戊率赶订鹰跨束持坦栅疙尘创内狙楞且寅鄙晨沥片娥妊嘻匪微胞摊健滓湍舍诞铂偶钝遣胡逗三移禁重啮刽畅紧急猛颂淋留画溜涕爪馈汤编驼砂榆阀烩舀锣黔哦质隧多柑婴死伏殿铜鸦挽说彦周季煤峦抠昨窥秩童窥孽哲账几茂吞质套底迫毅怯杨腕娇苍氧甫酸郡执状矣整鼓喊屈踌黄蝎躺园吵扫惯犹费罗棠思娱生滨振星渭雍家活缔则椭渺吱娜橱绦根宵闯龟搜索引擎简单工作原理看见网上很多人都在问搜索引擎的工作原理,今天称有时间就来简单的说一下,仅适用于初学者,大虾请绕行!       搜索引擎的工作原理大致可以分为三个阶段:爬行和抓取、预处理、排名       一、爬行和抓取              搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器,蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。为了提高爬行和抓取速度,搜索引擎都是使用多个蜘蛛并发分布爬行。,,蜘蛛将遵守协议,不抓取被禁止的网址。。               为了抓取网上尽量多的页面,搜素引擎蜘蛛会跟踪页面上的链接,从一个页面爬行到下一个页面,就好像蜘蛛在蜘蛛网上爬行一样,