文档介绍:第一章绪论
《信息存储与检索》
本章目录
第一节信息检索基本理论
第二节信息检索系统
第三节信息检索研究
2
《信息存储与检索》
第一节信息检索基本理论
信息检索的概念
1
信息检索的原理
2
信息检索的类型
3
3
《信息存储与检索》
信息检索的概念
“信息检索”(Information Retrieval,IR,我国早期译为“情报检索”)一词最早出现于1952年,由美国学者穆尔斯()提出,从1961年开始在学术界和实践领域中得到广泛的应用[1]。信息检索这一概念首先假设包含相关信息的文献或记录已经按照某种有助于检索的顺序组织起来。信息检索就是对信息项进行表示、存储、组织和存取的全过程。对信息项的表示和组织应该能够为用户提供其感兴趣信息的方便存取。遗憾的是,对用户信息需求进行全面而准确的描述不是一件轻而易举的事情。
4
《信息存储与检索》
信息检索的概念
信息检索的概念大体上可以分为两类:
1、广义上来说,信息检索包括存储和检索两个过程。信息存储是指将有用的信息按照一定的方式组织和存放起来;信息检索是指当用户需要这些信息时,再把它们从存放的地方查找和提取出来。
2、狭义上来说,信息检索是按照一定的方式从现有的信息集合或数据库中,找出并提取所需要的信息。它仅指检索这一过程,不关心信息的存储。
5
《信息存储与检索》
信息检索的原理
信息检索的基本原理可以用下图表示
信息资源
信息搜集
需求分析
信息需求
信息用户
信息分析
信息表达
词语转换
需求表达
词语转换
数据库
检索结果
检索语言
信息存储过程
信息检索过程
图1-1 广义信息检索的基本原理
6
《信息存储与检索》
信息检索的原理
在上图中包括两个过程:
1、存储过程:负责信息检索系统和数据库建立的人从各种各样的信息资源中,搜集有用的信息,对有用信息进行主题内容分析,找出能够全面、准确表达该信息主题内容的概念,借助于检索语言把分析出来的概念转换成检索系统所采用的词语,再按照一定的规则和方式将这些有用信息组织成可供检索用的数据库,并存储在一定的介质上。
7
《信息存储与检索》
信息检索的原理
2、检索过程:用户首先对自己的需求进行主题内容的分析,找出能够全面、准确表达该需求主题内容的概念,也要借助于检索语言把分析出来的概念转换成检索系统所采用的词语,再按照一定的检索规则和方式指定检索策略,构造检索式,从数据库中查找并获得自己所需要的信息,最后输出检索结果。检索的全过程还包括对检索结果的评价、反馈、或许还要重新制定检索策略,重新构造检索式,反复进行检索,直至检索出满意的结果为止。
8
《信息存储与检索》
信息检索的原理
从图1-1中还可以看出,信息存储和信息检索有两个交汇处:一个是直接的,即表达信息主题内容的词语与表达需求主题内容的词语之间进行对比的交汇;另一个是间接的,即通过检索语言进行沟通,确保把存储用词和检索用词都统一到同一个检索语言体系中(对于自然语言检索系统来说,不存在存储与检索的间接交汇处)。
9
《信息存储与检索》
从由此可见,信息存储和信息检索的直接交汇处是至关重要的,由此形成了信息检索的一致性匹配作用机理,如图1-2所示。
信息检索的原理
比较
判断
选择
符号化表示
信息特征提取
符号化表示
需求特征提取
现实的信息
现实的需求
输出检索结果
图1-2 信息检索的一致性匹配作用机理
信息检索的一致性匹配作用机理包括5个机理:
(1)提取机理
(2)表示机理
(3)比较机理
(4)判断机理
(5)选择机理
10