1 / 3
文档名称:

基于Lucene的搜索引擎设计与实现.pdf

格式:pdf   大小:1,066KB   页数:3页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Lucene的搜索引擎设计与实现.pdf

上传人:wxc6688 2021/11/12 文件大小:1.04 MB

下载得到文件列表

基于Lucene的搜索引擎设计与实现.pdf

文档介绍

文档介绍:计 算 机 工 程 2011 年 8 月
第 37 卷 第 16 期
August 2011
Computer Engineering

·软件技术与数据库· 文章编号:1000—3428(2011)16—0039—03 文献标识码:A 中图分类号:

基于 Lucene 的搜索引擎设计与实现
赵 珂,逯 鹏,李永强
(郑州大学电气工程学院,郑州 450001)
摘 要:针对目前教育网庞大的 FTP 资源检索困难的问题,提出一种基于 EdtFTPJ 和 Lucene 的 FTP 搜索引擎的设计和实现方案。该方案
整体上采用基于 框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,索引模块应
用倒排索引方法,系统的分词算法使用基于字典的正向最大匹配中文分词法。实验结果表明,该方案具有较高的资源检索率,同时能够保
证检索结果的准确性。
关键词:FTP 搜索引擎;Lucene 框架;模型-视图-控制器;有限状态自动机;倒排索引
Design and Implementation of Search Engine Based on Lucene
ZHAO Ke, LU Peng, LI Yong-qiang
(School of Electrical Engineering, Zhengzhou University, Zhengzhou 450001, China)