1 / 2
文档名称:

lucene介绍.doc

格式:doc   大小:20KB   页数:2页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

lucene介绍.doc

上传人:xxq93485240 2019/6/20 文件大小:20 KB

下载得到文件列表

lucene介绍.doc

相关文档

文档介绍

文档介绍:Lucene介绍什么是lucene:Lucene是一个全文搜索框架,而不是应用产品。因此它并不像ogleDesktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。2lucene的工作方式???lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源。???源字符串首先经过analyzer处理,包括:分词,分成一个个单词;去除stopword(可选)。将源中需要的信息加入Document的各个Field中,并把需要索引的Field索引起来,把需要存储的Field存储起来。???将索引写入存储器,存储器可以是内存或磁盘。???用户提供搜索关键词,经过analyzer处理。对处理后的关键词搜索索引找出对应的Document。用户根据需要从找到的Document中提取需要的Field。学完后能做什么(使用范围)我们使用Lucene,主要是做站内搜索,即对一个系统内的资源进行搜索。如BBS、BLOG中的文章搜索,网上商店中的商品搜索等。使用Lucene的项目[anizationsmentionedonthePoweredbyLucenepageonLucene’sWiki,anumberofotherlarge,wellknown,,theEncyclopediaBritannicaCD-ROM/DVD,FedEx,flix,LinkedIn,Hewlett-Packard,NewScientistmagazine,,Atlassian(Jira),Epiphany,MIT’sOpenCoursewareandDSpace,Akamai’putingplatform,Digg,,too!]有Eclipse、Jira等。一般不做互联网中资源的搜索,因为不易获取与管理海量资源(专业搜索方向的公司除外)。所以,学完Lucene后我们就可以为自已的系统增加全文检索的功能。跟这个学****内容相关的练****为:为“传智手播客贴吧”增加搜索其中的文章的功能。lucene(全文搜索)概念:全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。中文分词器中文的分词比较复杂,因为不是一个字就是一个词,而且一个词在另外一个地方就可能不是一个词,如在“帽子和服装”中,“和服”就不是一个词。对于中文分词,通常有三种方式:单字分词、二分法分词、词典分词。l单字分词:就是按照中文一