1 / 3
文档名称:

局域网FTP搜索引擎的建立.doc

格式:doc   大小:14KB   页数:3页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

局域网FTP搜索引擎的建立.doc

上传人:lukas 2022/7/3 文件大小:14 KB

下载得到文件列表

局域网FTP搜索引擎的建立.doc

相关文档

文档介绍

文档介绍:局域网FTP搜索引擎的建立
  摘要FTP效劳是网络效劳的一种应用广泛的文件传输形式,本文拟构建一个基于eb的FTP主机的文件搜索系统,可以以eb形式轻松的检索FTP上的文件,并且可以直观的以eb形式模拟FTP主机的文件构造。关键词搜索引局域网FTP搜索引擎的建立
  摘要FTP效劳是网络效劳的一种应用广泛的文件传输形式,本文拟构建一个基于eb的FTP主机的文件搜索系统,可以以eb形式轻松的检索FTP上的文件,并且可以直观的以eb形式模拟FTP主机的文件构造。关键词搜索引擎;FTP;eb
  1背景当前,计算机网络已经越来越普及,各个单位也已经逐步建立自己的FTP〔FileTransferPrtl〕效劳器,用来管理存储对于自己单位内部共享的一些文件或者对外共享的一些文件。随着被FTP管理的文件数量的不断增长,到达上万、上百万,甚至更多的时候,如何在如此庞大数据里边更快捷的找到自己所需的文件,将成为一个很重要的问题。目前出现了一些FTP搜索引擎,可以用来搜索整个互联网内处于匿名访问的FTP上的文件信息,而需要权限才能访问的FTP那么无法直接建立索引,因此不能到达搜索效果。本文拟构建的FTP搜索引擎是针对单位内部,局域网内的一个或者几个FTP效劳器建立的;使内部用户直接可以看到FTP上的目录构造,并可以准确的搜索文件位置,然后下载阅读,到达检索高效、准确。2拟构建系统之模型系统构建网络拓扑模型如图1所示。
  图1系统拓扑模型
  根据拓扑构造,内部网络部署假设干台FTP效劳器,根据需要,在每台需要被查询的FTP效劳器上,建立扫描文件构造发生变化的爬虫程序,并在内部网络建立FTP文件索引数据库效劳器,用来存放FTP效劳器上爬虫程序获取的索引数据,另外还要建立eb效劳器,用来做eb查询。3系统形式分析本系统采用两个模块构建,分别是部署于FTP效劳器的爬虫程序和部署于eb效劳器的索引查询引擎。部署于FTP效劳器的爬虫是一用来监控FTP文件构造变化的程序,它用来监视FTP效劳器的变化,当FTP效劳器有新的文件上传或者有文件被删除或者文件位置发生变化的时候,爬虫程序会立即捕捉到此变化,然后将变化信息响应到建立索引的数据库效劳器。部署于eb效劳器的查询引擎是主要用来做查询效劳,以及针对用户输入的查询关键字做模糊处理,直接以模糊方式查询,当搜索到结果以后,显示时候将文件所处FTP位置显示,同时将对应的超级连接做在上边,可以方便直接下载。在访问范围上,拟构建的搜索系统可以供内网和外网同时检索,访问方式
  如图一所示,将eb效劳器发布在内部网络,同时开放到Internet,可提供到Internet访问。通过eb效劳器来对内和对外提供检索效劳。内部用户通过内部网络直接访问eb效劳器来访问搜索引擎,外部用户通过Internet来访问eb搜索引擎。4系统的实现FTP效劳器爬虫程序主要用来建立FTP文件的树形构造,如图2所表示,每获得一个效劳器就建立一个FTP根节点,然后在遍历根节点下边的子节点,直到将子节点遍历完毕。FTP效劳器爬虫程序可以采用Java或者++等程序来实现,可以作为操作系统的一个效劳来加载。此种爬虫程序可以根据需求分为两类,一类是实时记载效劳器文件构造变化的,一类是分周期的记载数据库变化的。
  图2FTP爬虫遍历获得数据构造实时记载的爬虫程序