文档介绍:周志峰
图书馆数字资源与信息咨询部
******@wzu.
QQ:281206359
第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索系统
(三)信息检索语言
(四)信息检索的基本步骤
(五)信息检索技术
(六)信息检索评价
信息检索系统
1、信息检索系统的组成:一个完整的信息检索系统,通常由以下几个功能模块组成:信息源选择与采集子系统、标引子系统、建库子系统、词表管理子系统、用户接口子系统、提问处理子系统。(参阅后图)
2、信息选择子系统:本功能模块的任务是:根据系统的目标和服务对象的需要,确定数据收集范围,并广泛地、定期地采集各种信息源,为系统提供充足而适用的数据。
3、标引子系统:标引,就是根据系统的规则和程序,对文献内容进行分析,然后赋予每篇文献以一定数量的内容标识(如分类号、主题词、关键词等),作为存储与检索的依据。标引作业通常与文献编目和文摘工作一起进行,然后把标引结果和其他描述事项(如著者、著者单位、文献出处等)填入工作单,由录入员输入到计算机中。
4、建库子系统:本模块的功能是建立和维护可直接用于检索的数据库,包括系统所用的各索引文档。其工作流程主要包括数据录入、错误检查与处理、数据格式转换、生成并定期更新各种文档。
信息检索系统
5、词表管理子系统:词表管理子系统管理维护系统中已有的词表,使它与标引、建库等子系统相连接,支持用户查询操作,并从提问、对话或其它文本中采集新的词汇信息,以及输出各种形式的词汇数据或词表产品。
6、用户接口子系统:它的全称是“系统-用户接口”,简称用户接口,是面向系统用户的人-机接口程序。它承担用户与系统之间的交流功能,是信息系统中不可缺少的模块。
7、提问处理子系统:提问处理子系统专门负责处理用户输入的提问式,将提问式中的检索元和算符区分,并转换成系统内部的可接受的命令方式。在对提问进行转换后,与数据库中存储的数据进行比较运算,然后把运算结果输出给用户。
信息检索系统
信息检索语言
是根据文献存贮与检索的需要,在自然语言的基础上规范化了的一种人工语言。
·分类语言
·主题语言
分类语言
主题语言