1 / 67
文档名称:

基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现.pdf

格式:pdf   页数:67
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现.pdf

上传人:Horange 2014/2/28 文件大小:0 KB

下载得到文件列表

基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现.pdf

文档介绍

文档介绍:西南交通大学研究生学位论文基于平台与的信息文档搜索引擎系统的设计与实现业让篡扭座旦堇苤年姓专二零一一年五月一奄一一QT国内图书分类号:国际图书分类号:密级:公开
篗篏:...
指导老师签名:式每歹学位论文作者签名:移何争日期:≯.工日期:占沈【.\易西南交通大学曲南文迥大罕学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于C芸冢年解密后适用本授权书;槐C苋埃褂帽臼谌ㄊ椤朐谝陨戏娇蚰诖颉ⅲ
学位论文作者签名:榜≥彳等一,日期:。西南交通大学硕士学位论文主要工作毕声明本人在学位论文中所做的主要工作或贡献如下:构建了一个基于平台信息文档搜索引擎系统,利用轻量级框架的优势,降低了项目中各层的耦合度,提高了可扩充度,在一定程度上提升了开发效率。引入了第三方分词工具包庖丁分词器提高了分词效率,使用网络爬虫对网页进行抓取及进行解析,利用第三方分析工具包对日常办公文档、冉馕鎏崛。最终利用的愿餍畔⑽牡到⑺饕迪侄孕畔⒌募焖鳌在检索中结合了技术,使得操作更具有交互性和人性化。本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。
摘要西南交通大学硕士研究生学位论文第随着互联网的日新月异的发展,网络应用已涉及到各大企业以及文献机构的方方面面,因而因使用互联网无时不刻都在产生着惊人的数据和信息。同时也因企业以及各大机构本身各个业务环节也会产生大量的信息文档,而这些信息文档中很大的部分属于异构文档,极其不利于检索及管理。为了极大程度提高信息资源的共享率和利用率,需要一套高效的检索系统。本文结合行业搜索引擎的特点以及当前的实际需求,采用了基于平台,使用语言以及结合设计模式思想采取多层架构技术,同时融合了、等当前的流行技术,完成了对信息文档搜索引擎系统的开发。论文首先介绍了课题的研究背景与意义,并分析了当前的信息文档检索的现状以及未来的发现方向。接着对搜索引擎系统所要用到的相关技术与基本原理进行了阐述与分析。然后从信息采集、索引建立、信息检索等多方面初步的分析了信息文档搜索引擎系统的总体需求,以及系统的功能与数据需求。因为系统是面向用户的,因此运用了面向对象思想的统一建模语言治霾⒏隽讼低车挠美技白芴寮芄图。其次,基于需求分析的基础上,划分并设计了系统的各个核心版块以及功能,使用流程图详细的说明了各大核心版块的处理流程。再次,同时也运用了杓屏系统各个版块部分的静态结构图,结合静态结构图以及对象实体设计了系统的数据库。最后,对系统的各个版块经行了详细的设计与实现,给出了这些模块的时序图以及运行图。该系统具有简洁直观的用户界面,人性化操作,使用简单便捷,能较好的满足用户的检索需求。关键词:搜索引擎;;;网络爬虫;
.,’,鸭琣..,—琣琣,;;:.锄,.,瑄瑆,...,,,.篠,瑂琺,琁籎
录目西南交通大学硕士研究生学位论文第第滦髀邸璴研究背景和研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.国内外现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.主要研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.论文结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第孪喙丶际跤牖驹怼全文检索分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.系统结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯索引分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯结果排序⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据流⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。分词及高亮原理⋯⋯⋯⋯⋯⋯⋯.概述及技术架构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..与⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一技术原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯δ芙樯堋第滦畔⑽牡邓阉饕嫦低承枨蠓治觥总体功能需求⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第滦畔⑽牡邓