文档介绍:源程序代码等全套设计联系QQ 695132052 各专业都有
分类号: U D C:D10621-408-(2007)5819-0
密级:公开编号:2003032115
成都信息工程学院
学位论文
基于Ajax+Lucene构建搜索引擎的设计与实现
论文作者姓名:
闫秋云
申请学位专业:
网络工程
申请学位类别:
工学学士
指导教师姓名(职称):
方睿(副教授)
论文提交日期:
2007年06月10日
基于Ajax+Lucene构建搜索引擎的设计与实现
摘要
通过搜索引擎从互联网上获取有用信息已经成为人们生活的重要组成部分,Lucene是构建搜索引擎的其中一种方式。平台上用C#开发的,数据库是MSSQL Server 2000。主要完成的功能有:用爬虫抓取网页;获取有效信息放入数据库;通过Lucene建立索引;对简单关键字进行搜索;使用Ajax的局部刷新页面展示结果。
论文详细说明了系统开发的背景,开发环境,系统的需求分析,以及功能的设计与实现。同时讲述了搜索引擎的原理,系统功能,并探讨使用Ajax与服务器进行数据异步交互,从而改善现有的Web应用模式。
关键词:;异步更新;Ajax;搜索引擎
The Design and Implementation for Constructing the Search Engine with Ajax and Lucene
Abstract
Obtaining useful information from web by search engines has e the important part of people's lives. Lucene is the way of constructing search engine. This system is based on the .Net platform using C#. The database is MSSQL Server 2000. Main functions are grasping web pages with crawls, adding effective information to the database, establishing index with Lucene, searching through keywords, and displaying the results finally.
This paper has showed the principle of search engine in the form of different modules, functions of this system, improving traditional web application model using Ajax. It shows explanation of the system’s background, development environment, system analysis of demanding, and functions of design.
Key words: ; Asynchronous update; Ajax; Search engines
目录
论文总页数:19页
1 引言 1
课题背景 1
国内外研究现状 1
本课题研究的意义 1
本课题的研究方法 1
2 构建搜索引擎原理 2
全文搜索引擎 2
搜索引擎的分类 2
搜索引擎的工作原理 2
Lucene与搜索引擎 3
索引和搜索 4
Ajax技术 4
3 需求分析 5
同步环境 5
6
性能需求 6
输入输出要求 7
运行需求 7
4 方案设计 7
搜索引擎模型 7
数据库的设计 7
模块设计 8
5 系统实现 10
开发环境 10
关键代码详解 10
代码结构 10
爬虫部分 11
12
13
6 测试 14
功能测试 14
结论 16
参考文献 17
致谢 18
声明 19
1 引言
课题背景
Lucene是一个基于Java的全文信息检索工具包,它为应用程序提供索引和搜索功能。Lucene目前是Apache Jakarta家族中的一个开源项目。也是目前最为流行的基于Java开源全文检索工具包。Lucene