文档介绍:毕业论文题目: 网络搜索引擎应用研究_ 学院: 信息工程学院学生姓名: 李旭东梁世鸿马丽娜他丽娟指导教师: 岳建斌起讫日期: 2010 年5月 12日___________ 摘要搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列,方便用户查找。如何更加快捷、准确地查找到用户所需的网络信息资源,是各大搜索引擎服务提供商和计算机网络研究人员的研究热点。作为计算机专业的学生,搜索引擎技术对我们有很大的诱惑力,了解搜索引擎的发展现状、原理和技术手段,从算法的角度来认识搜索引擎,是我们必须掌握的知识之一。本文主要研究搜索引擎的基本原理、搜索算法及实现技术。关键字:搜索引擎、基本原理、搜索算法、技术。目录摘要…………………………………………………………………………………… 1 第一章引言…………………………………………………………………………… 5 …………………………………………………………… 6 . 1搜索引擎的初显……………………………………………………………… 6 . 2搜索引擎的发展……………………………………………………………… 6 搜 索引擎在我国的发展现状……………………………………………………… 8 . 1我国搜索引擎的背景………………………………………………………… 8 搜 索引擎的现状……………………………………………………………… 9 本文的研究内容………………………………………………………………… 10 第二章搜索引擎的原理…………………………………………………………… 11 搜索引擎的原理概述…………………………………………………………… 11 搜索引擎的实现原理…………………………………………………………… 12 从互联网上抓取网页……………………………………………………… 12 建立索引数据库…………………………………………………………… 12 在索引数据库中搜索……………………………………………………… 13 对搜索结果进行处理排序………………………………………………… 13 垂直搜索引擎的工作原理……………………………………………………… 14 垂直搜索引擎的基本原理………………………………………………… 14 垂直搜索引擎的技术原理………………………………………………… 14 垂直搜索引擎技术框架…………………………………………………… 15 第三章搜索引擎的核心--网络蜘蛛……………………………………………… 16 网络蜘蛛………………………………………………………………………… 16 网络蜘蛛的介绍…………………………………………………………… 16 网络蜘蛛的工作原理……………………………………………………… 16 网络蜘蛛的结构分析…………………………………………………………… 17 如何解析 HTML ……………………………………………………………… 17 程序结构…………………………………………………………… 19 如何构建 Spider 程序……………………………………………………… 19 如何提高程序性能………………………………………………………… 20 网络蜘蛛的代码分析……………………………………………………… 21 网络蜘蛛的处理对象…………………………………………………………… 23 网络蜘蛛面临的难题…………………………………………………………… 23 第四章搜索引擎的主要技术……………………………………………………… 25 搜索器、索引器、检索器及用户接口………………………………………… 25 搜索器……………………………………………………………………… 25 索引器……………………………………………………………………… 25 检索器……………………………………………………………………… 25 用户接口…………………………………………………………………… 26 中文搜索引擎的中文分词技术………………