文档介绍:由搜索引擎谈数字图书馆的信息服务
孔足
深圳图书馆系统维护部广东深圳 518027
[摘要]本文简单介绍了互联网上的搜索引擎技术,并通过深圳图书馆开发的数字图书馆系统(dDILAS)的信息服务系统来说明如何利用搜索引擎技术,构建数字图书馆的信息服务系统。
[关键词]数字图书馆搜索引擎信息服务
From sSearch eEngineer to the iInformation sService in dDigital lLibrary
Kong zZu
Department of System Maintenance,Shenzhen Library,Shenzhen,Guangdong 518027
[Abstract]tThe paper first gives a brief introduction to the technologies of search engineer on the , then provides an example of information service system in digital library based on search engineer which is developed by Shenzhen lLibrary.
[Keywords]dDigital library,; sSearch engineer,; iInformation service
1 前言
随着互联网爆炸性的发展,网络上的信息呈现几何级数增长的趋势, 使其信息极为丰富。同时也因信息资源分散、缺乏信息的有效的信息组织、信息检索缓慢而困惑,人们不知如何快速、资源中获取自己最需要的信息。为了解决这些问题,搜索引擎便应运而生。
随着信息数字化的发展,数字图书馆成为了以后知识传播和、普及教育重要和有利的工具。为了帮助使用者能够快速、有效地利用网络上的巨量信息资源,我们同样要在信息服务上做很多的工作。在这里,我们本文拟将对互联网上的搜索引擎技术进行简单的介绍,并通过深圳图书馆开发的数字图书馆系统(DILASdILAS)的信息服务系统,来说明如何利用搜索引擎的技术来构建数字图书馆的信息服务系统。
21 搜索引擎的原理及分类
自1994 年第一个搜索引擎出现以来, 的主要查询工具。它从最早的第一代网站搜索引擎发展到第二代关键词搜索引擎,现在已发展到应用数据挖掘、人工智能等技术的第三代智能搜索引擎。
搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。它先由搜索器以一定的策略在互联网中搜集和发现信息,然后通过索引器对信息的进行理解、提取、组织和处理并存储到数据库中。最后在再通过用户接口及检索器的共同作用下为用户提供检索服务,从而起到信息导航的作用。
搜索引擎按其工作方式主要可分为三种,分别是目录式索引类搜索引擎、机器人搜索引擎和元搜索引擎。
目录式搜索引擎是最早出现的基于o为代表。它以人工方式或半自动方式搜集信息,大多面向网站,提供目录浏览服务和直接检索服务。其特点是搜索的信息准确、导航质量高,但信息量少,信息更新不及时且维护量大。
机器人搜索引擎是很常用的一种搜索引擎,主要以google为代表。搜索机器人(robot)主动地从互联网上检索信息并自建网页数据库,搜索结果直接从自身的数据库中调用。