1 / 106
文档名称:

03信息检索模型.ppt

格式:ppt   大小:1,563KB   页数:106页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

03信息检索模型.ppt

上传人:xgs758698 2017/6/30 文件大小:1.53 MB

下载得到文件列表

03信息检索模型.ppt

文档介绍

文档介绍:这一部分将讲述
布尔模型,向量空间模型,扩展的布尔模型
概率模型和基于语言模型的信息检索模型的区别和联系
基于本体的信息检索模型和基于隐性语义索引的信息检索模型
信息检索模型的概述
什么是模型?
模型是采用数学工具,对现实世界某种事物或某种运动的抽象描述
面对相同的输入,模型的输出应能够无限地逼近现实世界的输出
举例:天气的预测模型
信息检索模型
是表示文档,用户查询以及查询与文档的关系的框架
信息检索模型
信息检索模型是一个四元组[D, Q, F, R(qi, dj)]
D: 文档集的机内表示
Q: 用户需求的机内表示
F: 文档表示、查询表示和它们之间的关系的模型框架(Frame)
R(qi, dj): 排序函数,给query qi 和document dj评分
信息检索模型取决于:
从什么样的视角去看待查询式和文档
基于什么样的理论去看待查询式和文档的关系
如何计算查询式和文档之间的相似度
模型分类
信息检索模型
布尔
向量空间
概率
知识
模糊集
扩展的布尔模型
集合论
代数
扩展的向量空间
隐性语义索引
神经网络
语言模型
推理网络
信念网络
概率
基于本体论的模型
人工智能
布尔模型(Boolean Model)
布尔模型
最早的IR模型,也是应用最广泛的模型
目前仍然应用于商业系统中
Lucene是基于布尔(Boolean)模型的
布尔模型描述
文档D表示
一个文档被表示为关键词的集合
查询式Q表示
查询式(Queries)被表示为关键词的布尔组合,用“与、或、非”连接起来,并用括弧指示优先次序
匹配F
一个文档当且仅当它能够满足布尔查询式时,才将其检索出来
检索策略基于二值判定标准
算法R
根据匹配框架F判定相关
举例
Q=病毒AND(计算机OR电脑)ANDNOT医
文档:
D1:…据报道计算机病毒最近猖獗
D2:小王虽然是学医的,但对研究电脑病毒也感兴趣…
D3:计算机程序发现了艾滋病病毒传播途径
上述文档哪一个会被检索到?