1 / 59
文档名称:

毕业设计论文nutch爬虫系统分析.doc

格式:doc   页数:59页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

毕业设计论文nutch爬虫系统分析.doc

上传人:麒麟才子 2016/5/21 文件大小:0 KB

下载得到文件列表

毕业设计论文nutch爬虫系统分析.doc

相关文档

文档介绍

文档介绍:nutch 爬虫系统分析 Nutch 分析 1 Nutch 简介.................................................................................................................................. 2 nutch 体系结构.............................................................................................................. 2 2 抓取部分..................................................................................................................................... 3 爬虫的数据结构及含义................................................................................................ 3 抓取目录分析................................................................................................................. 4 抓取过程概述................................................................................................................. 4 抓取过程分析................................................................................................................. 5 inject 方法........................................................................................................ 6 generate 方法................................................................................................. 12 fetch 方法....................................................................................................... 14 parse 方法........................................................................................................ 16 update 方法...................................................................................................... 16 invert 方法...................................................................................................... 19 index 方法........................................................................................................ 23 dedup 方法........................................................................................................ 26 merge 方法............................................................................................