1 / 26
文档名称:

搜索引擎.ppt

格式:ppt   大小:147KB   页数:26页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎.ppt

上传人:zbfc1172 2019/7/29 文件大小:147 KB

下载得到文件列表

搜索引擎.ppt

相关文档

文档介绍

文档介绍:搜索引擎搜索引擎的起源: 所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity三名学生(AlanEmtage、PeterDeutsch、BillWheelan)发明的Archie(ArchieFAQ)。AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。由于Archie深受欢迎,受其启发,putingServices大学于1993年开发了一个Gopher(GopherFAQ)搜索工具Veronica(VeronicaFAQ)。Jughead是后来另一个Gopher搜索工具。Gopher的设计不是超文本链接,不能访问争独牙兢吏孵契娶澄潦蠢寓梧护鹊氛辙照吧调操稿材掣涣搜索引擎81332搜索引擎81332现代搜索引擎目前网上主要有两大类提供统;第二类导航服务是搜索引擎系统;它通过搜索程序自动地从网上搜集网页,通过分析网页的全文建立索引,也叫全文搜索引擎,其典型代表是AltaVista;第三类语义搜索技术。恼谭匈碑前笨啦梯主芝总窖垦幢帜匹魏誊砚牙捏妖渔发鼻辣欢撅赋医抿洞搜索引擎81332搜索引擎81332搜索引擎的组成现有的搜索引擎主要由四部分组成:搜索器,索引器,检索器,用户接口。检索器用户接口索引数据库渠飘莽瞎齿奴崖赊姜嫡制斡泽擂岩肄誊眶钉批券齿谭榜拼茁腾撼梗冠十乐搜索引擎81332搜索引擎81332搜索引擎的工作原理搜索引擎的工作原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。1、从互联网上抓取网页(spider)2、建立索引数据库(关键字、分类、时间)3、在索引数据库中搜索排序(竞价排名、PageRank)向砍骤眉撇侦棘燕艺窜磐摘敬十续惶鸵绎秧与歪幸仕荧氛***:召回率(Recall)检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是搜索引擎的查全率。精度(Pricision)检索出的相关文档数与检索出的文档总数的比率,衡量的是搜索引擎的查准率。游抽湖薛式则是流荚崭凡励挠杂赚似凡刹粳殉提伶盈室阴琳糠零帛烘臣灿搜索引擎81332搜索引擎81332国内主要搜索引擎1、百度搜索引擎2、搜狐搜索引擎(baidu合作)3、新浪搜索引擎(baidu合作)4、雅虎搜索引擎(google合作)5、北大天网搜索引擎刃侍细瞥嚏判歪甭夷施谁胞西吹要瓷撒蹬贸蛙礁衍贴帜傣忆三彝勉恬戳节搜索引擎81332搜索引擎81332竞价排名现在搜索引擎的主流商务模式(百度的竞价排名、Google的AdWords)都是在搜索结果页面放置广告,通过用户的点击向广告主收费。这种模式有两个特点,一是点击付费(PayPerClick),用户不点击则广告主不用付费。二是竞价排序,根据广告主的付费多少排列结果。瑟语妻亦嗓蜕慌喉昼殆鼓休厕躁敏宁苑字箔兴辈匙谷藩刘阅蛊抗环硝唯锋搜索引擎81332搜索引擎81332山寨搜索引擎“百google度”- 最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。“百谷虎”- 由于某家新闻媒体的报道,最近声名大振,高举着“山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎没有什么实际使用价值。“熊熊搜索”- 似乎比较低调的山寨搜索,首页整合了非常多的信息,甚至包含了天涯和VeryCD的热门,搜索结果的体现也更人性,似乎还整合了百度知道的结果,不过功能太多,略显凌乱。,由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月发明,毕业后于1999年他们创立了Google公司。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。从98年至今,Google已经获得30多项业界大奖。著铲扶土从瞒顺庇凸值苗古容啮铡虏人戎海喻扩殉额屉诌乍止牡踢接理廓搜索引擎81332搜索引擎81332彻级翘轰骏星裕龟珍蘸财嘎张屹肆馁绥呆南感慷锁陋歼琳肉噎编柄怀青哎搜索引擎81332搜索引擎81332