文档介绍:万方数据
基于的全文搜索引擎研究与应用全文检索引擎介绍周锦程,王丹瞖厦褡迨Ψ堆г菏担笾荻荚琎,随着企业信息化的迅猛发展,企业数字化信怠也大幅增长并形成了海量的电子文档,如何对这些文档进行有效的管理并提供有效的检索机制,以保证用户能够随时、快速、、百度等优秀的通用搜索引擎,,通用搜索引擎的覆盖率都不太高,很多信息都无法完全搜集;另一方面,通用搜索引擎的页面更新较慢,信息的实时性、,为了提高企业信息检索的效率,⋯、开发平台⒒怪J犊釪⑷、优异的索引结构、.【的体系结构作为一个优秀的全文检索引擎,,其次通过抽象将系统的核心组成部分设计为抽象类,具体的平台摘要:全文检索技术是信息检索领域广泛使用的基本技术,它是一个用写的全文索引引擎工具包,访问索引时问快,支持多用户访问,,:搜索引擎;全文检索;索引;信息检索中图分类号:文献标识码:文章编号:———.收稿日期:——作者简介:周锦程,男,贵州开阳人,硕士,助教,研究方向:软件开发技术,数据库技术,,:—;—籭籭·
万方数据
低成杓朴胧迪功能强大,实现复杂,但从根本上说,主要包括两个重要功能:一是对搜索内容建立索引库,以下霾街瑁航⑺饕⒉檎宜饕⒏滤饕企业搜索引擎针对企业内部多种数据源进行搜索,整个系统设计为龉δ苣?椋何牡到馕觥⑺饕实现部分设计为抽象类的实现,此外与具体平台相关的部分比如文件存储也封装为类,经过层层的面向对象式的处理,最终达成了一个低耦合高效率,容易二次开发的检索引擎系统.‘从图锌梢郧宄吹剑琇低秤苫〗峁狗庾啊⑺饕诵摹⒍,?,核心类包主要有三个:...该模块主要用于切分词;...媚?橹饕L峁┛獾亩列唇涌冢...;二是检索索引库,即根据查询条件从索引库中找出符合条件的文档,搜索时用二元搜索算法快速定位关键词,找到相匹配的关键字,查出相对应的文章位置,·
万方数据
川,面模块提出检索请求,用户界面模块调用全文检索模块在全文索引库中进行检索,将得到的检索结果返模块之间的关系如图荆建立、:文档解析模块将各种电子文