1 / 46
文档名称:

毕业论文基于Lucene的桌面搜索引擎.doc

格式:doc   大小:1,004KB   页数:46页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

毕业论文基于Lucene的桌面搜索引擎.doc

上传人:tanfengdao 2019/1/31 文件大小:1004 KB

下载得到文件列表

毕业论文基于Lucene的桌面搜索引擎.doc

文档介绍

文档介绍:毕业论文题目:基于Lucene的桌面搜索引擎学院:管理科学与工程学院专业:信息管理与信息系统摘要随着信息资源的高速膨胀和计算机硬件的高速发展,个人PC存储容量变的越来越大。要想在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档信息也随之变得越来越困难。而往往操作系统中自带的搜索器又不能完全满足我们的需求,因此我们迫切需要一款全新的桌面搜索引擎来帮助我们。本文首先简单介绍了基于因特网的搜索引擎的系统结构和原理,然后着重介绍了桌面搜索引擎和全文检索的相关知识,对基于Lucene的全文检索引擎的架构原理方面进行详细的说明,同时对Lucene的索引机制、系统结构,以及中文分词都进行了仔细分析。然后介绍了本文实现的一个基于Lucene的桌面搜索引擎。本桌面搜索引擎一个轻量级的全文检索软件,能够帮助用户方便地在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档。从指定的文件路径中按照目录层次进行解析、搜索,并把搜索到的每条信息进行索引后加入索引文件,然后通过Web服务器接受客户端请求后从索引文件中搜索出所匹配的信息。关键词:桌面搜索引擎、倒排索引、lucene、B/S、indetail,thengivesaminuteexplanationformBasedonthefull-,-leveldirectory,'requestsfromthewebserver,,itisnotonlyelaboratethecoretechnology,binewiththemoderncode,picturesincluded,:searchengine、lucene、B/S、file目录绪论 、特点及优势 —索引器设计 —索引器实现 41绪论 我们处在一个信息资源高速膨胀的时代,信息爆炸已成为一个全球性的现象。然而,面对极度膨胀的信息量,面对“混沌信息空间”和“数据过剩”的巨大压力,人们对于信息的苦苦追求和期待忽然间变得踟蹰了。每天在我们所生活在的这个世界都会出现大量的信息,如果能够对这些信息做出一些筛选,既可以为我们的广大用户提供一些好的知识与信息,,新产生的信息中有92%记录在硬盘等磁存储介质上,其次分别是胶片、纸张和光存储介质。也正因为如此各种搜索引擎也应运而生。搜索引擎的意义网络的出现把世界连接成了一个地球村,信息的传输再也不受到时间和空间的限制,但是处在这样一个信息爆炸的网络时代,仅仅是每天诞生的新知识,就可能让一个人一生也学不完。那么在这样一个“信息迷