1 / 18
文档名称:

第三讲信息检索原理与检索语言_.doc

格式:doc   页数:18页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第三讲信息检索原理与检索语言_.doc

上传人:中国课件站 2011/12/16 文件大小:0 KB

下载得到文件列表

第三讲信息检索原理与检索语言_.doc

文档介绍

文档介绍:第三讲信息检索原理与检索语言检索方法
一、信息检索的两种方法
信息检索有两种方法。一是直接从信息源和信息文献载体中获取信息。称为直接检索索。二是通过信息检索工具的指引获取所需的信息,称为间接检索。
直接检索是信息用户常用的检索方法。用这种方法检索时,可以明确判断所检到的信息是否符合需要,且对非文献载体的信息检索来说比较快速、方便。但对于现代大规模的信息检索,很难准确、系统的查到所需的全部信息。
间接检索克服了直接检索的缺点。它把信息“贴上”分类号或主题词等多种检索标志,并按照这些标志把信息有效地组织起来,在信息检索时利用检索标记可以查到所需信息的线索或信息本身。
二、信息检索的原理
直接检索的原理比较简单,即通过一定方法从信息源收集信息或直接浏览信息的文献载体获取信息。
间接检索则要通过信息检索系统来实现。信息检索系统运作的全过程包括存贮和检索两个过程。存贮过程就是运用检索语言对信息的外表特征和内容特征进行标引,形成文献特征标识,检索过程则先对检索提问进行标引,形成检索提问标识,按照存贮所提供的检索途径,查获与检索标识相符合的文献特征标识的过程,检索过程是存贮过程的逆过程。
三、检索语言的概念合作用
检索语言识一种专门的人工书面语言,它是信息检索系统存贮过程和检索过程所使用的共同语言。其最终目的是为检索而用,故名为检索语言。
存贮――标引
} 依据
检索――标引
检索语言的作用
(1) 检索语言用于标引信息的主题,可把信息的内容特征及外表特征简明而有效地揭示出来;
(2)检索语言通过对信息的标引,把内容相同及相关的信息集中在一起,加上检索语言本身的可序列化,从而可对大量信息进行系统化和组织,使规律的检索成为可能。
图书的排架、索书号: 。。。。。。
(3)检索语言的单一性和表述概念的唯一性以及检索语言在信息标引和信息检索时的同时运用,决定了存贮标识和检索标识的有效比较,为准确输出所需信息提供了前提
理论上

实际: 关键词:电脑
计算机
汉字输入法
汉字字形输入法
内容标识标引、主观性
寻找所有可能检索入口
或使用一些组配技巧
检索语言的种类
1、文献检索语言,反映的是文献信息的内容特征和外表特征。所以可以分为反映文献外表特征(著者、书篇名、号码)的语言和反映文献内容特征的语言。
表述文献外表特征的检索语言简单易懂,其形成的又非主要检索途径,故在检索语言中不予专门论述,通常所说的检索语言一般均指表述文献信息内容特征的语言。
2、按组配方式分,检索语言有先组式检索语言和后组式检索语言两大类。所谓组配就是将两个或两个以上的主题词按照一定的逻辑关系结合在一起表达文献主题或表达检索需求,称为主配标引。如:用动物学:遗传学表示动物遗传学
(关于先组式检索语言和后组式检索语言,以后有机会再通过具体例子说明)
3、按检索语言的结构原理来分,检索语言有分类语言、主题语言和分类主题一体化语言三大种类。
(1) 分类语言:分类语言式检索语言的一种主要类型,它可以分为体系分类语言和组面分类语言两种。
体系分类语言是一种传统的分类语言,具有列举时类目、分类符号标识、等级制结构、线性序列等特点。(以中图法为例展开文学大类)
按信息的学科属性来区分文献信息,在编制体系分类表时列举了所有的类目,一个类目只能归入一个学科,并用符号来表示相应的类目。
体系分类语言不能容纳主题概念的发展,其直线性系列无法按事物集中文献,所以后来发展出了组面分类。
汽车――设计
――销售
――空气调节
组面分类法,按学科范畴分为若干个组面,每个组面包括若干类目,每个类表示一个简单的主题概念(标引时组配,举例说明)。用分类符号作为组面和类目的标记。
:主题语言是用规范化自然语言作为揭示文献信息主题的标目,并按照字顺组织文献信息或检索文献信息的一种检索语言。它包括标题词语言、单元词语言、叙词语言、关键词语言
标题词语言――SHE
――主标题词、副标题词
\ /
规范化自然语言
词及组配方式固定先组式语言
单元词语言、规范化语言、通过组配来检索文献
采用最小字面单元来标引文献
\
单元词机检:后组
叙词:理论上最完善的规范化自然语言――{ 手检:先组
以规范化的名词作为基础的一种检索语言,通过概念的组配来表达文献信息
缺点:核对对词表
关键词:直接选自文献信息标题或内容中具有实质意义的自然语言作为标引和检索文献信息主题概念的检索语言。
非规范化的自然语言
\
不符合主题检索语言的定义

把分类法和主题法合在一起,