1 / 58
文档名称:

基于Lucene职位垂直搜索引擎的研究和实现.pdf

格式:pdf   页数:58页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Lucene职位垂直搜索引擎的研究和实现.pdf

上传人:hytkxy 2016/5/27 文件大小:0 KB

下载得到文件列表

基于Lucene职位垂直搜索引擎的研究和实现.pdf

文档介绍

文档介绍:摘要众所周知,互联网随着其不断发展壮大,已经成为最大的信息库。面对如此巨大的互联网资源,用户如何从中快速、准确、全面的获取所需信息已经成为亟待解决的问题。为了帮助用户解决这一问题,出现了搜索引擎。近年来,随着中国网络招聘市场的不断扩大,大部分求职者不得不花费大量的时间在一个个的招聘网站上进行繁琐的注册和寻觅职位,甚至成为了一项特殊时期的全职工作。一种新型网络工具——职位搜索引擎的推出,开始让这种局面悄然变化。职位搜索引擎属于垂直搜索引擎的一种,它们可以处理招聘网站上的大量求职、招聘信息,为求职者提供准确快捷的搜索服务。本论文介绍了垂直搜索引擎的概念及其和传统的搜索引擎的区别,介绍了 Lucene的系统结构和索引结构。分析了垂直搜索引擎的主要的技术,讨论了 Lucene全文检索的实现过程以及Lucene的实际应用。本文分析研究了面向求职者的垂直搜索引擎的原理、相关技术及其实现过程,对于国内著名的招聘网站利用采集器进行信息提取,并利用Lucene对提取的信息建立索引,以构建一个面向求职者的垂直搜索引擎。本系统使用丌源的工具包Lucene实现程序功能,整体系统分为词库模块、数据库模块、信息采集模块、索引模块以及检索模块。本文根据求职者对搜索职位信息的实际需求,分析、设计和实现本系统,主要从提高系统检索速度和检索准确率来进行系统设计。关键词:垂直搜索引擎;职位搜索;索引;检索 Abstract Asweallknow,with itsexpansion, already became thebiggest information such great resources,how torapidly,accurately, comprehensive acquire information e order tohelp customers solve thisproblem,the searchengine appear. In recent years,China’work employment market inexpanding constantly, most applicants have tospend alotoftime in recruitment website fortrival registered and looking forposition information,even e aspecial period of full- new tool-job search engine,began tochanges this belongs to avertical searchengine,they Can handle collection etcrecruitment onlineinformation,the large amount ofwork forthe applicants toprovide accurate quick search services. Thispaper introduces theconcept ofthe verticalsearchengine,the difference between verticalsearchengine and traditional search engine,introduces thesystem structure and index structure themain verticalsearchengine technology,discusses therealizationprocess ofLucene full—text retrieval and Lucene ofactualapplication. This paper analyzed the vertical searchengine forjob seekers,the principle of therelevant technology and itsrealization process,for thedomesticfamous recruitment websiteinformation extractionusing collector of extraction using Lucene indexed theinformation toconstruct averticalsearchengine forjob system us