文档介绍:FTP 搜索引擎的设计与实现张运凯刘宏忠郭宏刚摘要: FTP 是因特网最主要的服务之一, FTP 搜索引擎为人们使用 FTP 服务提供了很大的方便。本文分析和设计了一个基于 WEB 的 FTP 搜索引擎,并在 PHP+Mysql 环境下给出了编程实现方法。关键词: FTP ;搜索引擎; PHP ; Mysql; 引言 FTP 是因特网最主要的服务之一,在 FTP 服务器上保存有大量的各种各样的共享软件、技术资料和多媒体数据等文件。因为每个 FTP 服务器都有若干个目录, 其目录和文件结构比较复杂,要在 FTP 服务器上找到自己需要的文件不是一件容易的事情, 要在多个 FTP 服务器上查找文件更是困难。基于擎可以很好的解决上述问题。目前, 国内外有很多 FTP 搜索引擎, 国内较著名的有北大天网、百合谷搜索和 FTP 星空搜索等。为了更好的为我校校园用户和省主节点用户提供服务,我们设计了自己的 FTP 服务器搜索引擎。 1. FTP 搜索引擎的结构 FTP 搜索引擎由数据采集、数据查询和站点维护等模块组成。实现一个 FTP 搜索引擎,首先要收集各个 FTP 站点上的文件信息,并把这些信息存储到数据库中;然后给用户提供一个查询界面, 以收取用户要查询的信息, 把这些查询信息转化为数据库语言, 并进行数据库查询, 把查询结果以友好的界面显示给用户;搜索引擎建立好以后,为了使数据库数据与 FTP 站点的数据保持一致,需要更新 FTP 站点的文件信息,添加新的 FTP 站点等管理和维护。其结构如下图所示。我们在设计 FTP 搜索引擎时,采用 Linux 操作系统 , ,数据库采用 MySQL ,编程语言采用 PHP 。 2. 数据库结构和设置 文件信息分析在 FTP 站点上,根目录下的目录中又有许多文件夹和文件,每一个文件的信息包括文件名,文件地址, 文件大小, 日期, 类型等。对应这些文件信息, 在文件数据库中设置相应的字段, 用来纪录这些信息, 用字段 name 存储文件名, 一般不超过 255 个字符, 设置为 varchar 类型, 长度为 255 , host 表示 FTP 网站的名称,说明是哪一个网站上的文件, address 字段准确给出文件的 URL 地址, 由于有些文件 URL 比较长,把 address 字段类型设置为 longtext , 有了这些字段, 就可以在网络中找到此文件的位置。另外, 还需要纪录下文件的大小, 时间, 日期, 以供用户分辨选择他们所要的文件。最后, 查询时对文件名字段的访问比较频繁, 把它设置成 Index 字段, 这样可以提高查询速度。 FTP 站点信息分析一个 FTP 站点通常包含服务器名称, 用户名, 和密码。对应 FTP 站点的信息, 数据字段设置如下:设置站点名、站点 IP 地址、用户名、用户密码等几个字段,站点名字段类型为 vchar, 长度为 60, IP 地址 vchar 类型,长度为 50, 用户名 vchar 类型,长度 50 ,密码设置为 password 类型,长度为 60 。另外, FTP 站点名也是使用较为频繁的数据,把它设置为 Index 字段。 数据库结构设置基于以上分析, 设置数据库如下:在 file_address 数据库中有两个数