1 / 17
文档名称:

情报检索系统中的信息组织.ppt

格式:ppt   大小:1,224KB   页数:17页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

情报检索系统中的信息组织.ppt

上传人:54156456 2025/4/27 文件大小:1.20 MB

下载得到文件列表

情报检索系统中的信息组织.ppt

相关文档

文档介绍

文档介绍:该【情报检索系统中的信息组织 】是由【54156456】上传分享,文档一共【17】页,该文档可以免费在线阅读,需要了解更多关于【情报检索系统中的信息组织 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。情报检索系统中的 信息组织
情报检索定义:信息单元的表示、存储、组织和存取
旨在满足用户的信息需求
用户的信息需求例如:
找到关于姚明在休斯敦火箭队的所有文献,包含 (1) 他与其他几位中国球员的交往 或(2) 他与女友的交往;
重点在查找相关信息,而不是数据
目标
数据检索Data Retrieval
文献包含的关键词是数据
含义固定
一点小错误会造成查找失败
情报检索Information retrieval
关于一个主题或话题的信息
含义常常比较宽松,有一定范围
允许一些错误,不影响查到相关内容
情报检索系统IR system:
对信息对象内容的解释
排序反映了相关性
相关性是最重要的概念
情报检索时代的来临
情报检索已不是图书情报领域关心的课题,随着万维网的来临,一跃成为受人关注的关键技术之一。
基本模型
用户目标
检索
信息或数据
有目的地
浏览
随意冲浪
F1; cars, Le Mans, France, tourism
Retrieval
Browsing
Database
基本概念
文件的逻辑视图
数字化文本可以用全文进行索引,而不必只取“关键词”或“分类号”
结构
分词
禁用词
名词 词组
词干/同义词
人工标引
文件
结构提取
全文
索引词
情报检索流程
用户界面
文本操作
提问式操作
标引
检索
排序
索引
文本
提问
用户需求
用户反馈
经过排序文件
获取文件
逻辑视图
逻辑视图
倒排档
数据库管理模块
4, 10
6, 7
5
8
2
8
文本数据库
文本
情报检索系统采用索引词处理提问(匹配)
索引词:
关键词或者规范词
任意词
用到切分或截词:
connect: connecting, connection, connections
倒排档用于查检操作
简介
Introduction
文件
01
信息需求
02
索引词
03
文件
04
提问
05
排序
06
匹配
07
简介
排序是检出文献对于用户提问的相关程度的顺序
以下原因造成问题:
索引词的匹配不太精确
用户常常会不满足
由于用户没有经过提问式编写的培训,检索效果会更糟
Web上的情报检索更是如此
相关性的测度成为匹配与排序的关键问题