1 / 104
文档名称:

03信息检索模型.ppt

格式:ppt   大小:746KB   页数:104页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

03信息检索模型.ppt

上传人:cby201601 2020/7/24 文件大小:746 KB

下载得到文件列表

03信息检索模型.ppt

文档介绍

文档介绍:信息检索模型这一部分将讲述布尔模型,向量空间模型,扩展的布尔模型概率模型和基于语言模型的信息检索模型的区别和联系基于本体的信息检索模型和基于隐性语义索引的信息检索模型信息检索模型的概述什么是模型?模型是采用数学工具,对现实世界某种事物或某种运动的抽象描述面对相同的输入,模型的输出应能够无限地逼近现实世界的输出举例:天气的预测模型信息检索模型是表示文档,用户查询以及查询与文档的关系的框架信息检索模型信息检索模型是一个四元组[D,Q,F,R(qi,dj)]D:文档集的机内表示Q:用户需求的机内表示F:文档表示、查询表示和它们之间的关系的模型框架(Frame)R(qi,dj):排序函数,给queryqi和documentdj评分信息检索模型取决于:从什么样的视角去看待查询式和文档基于什么样的理论去看待查询式和文档的关系如何计算查询式和文档之间的相似度模型分类信息检索模型布尔向量空间概率知识模糊集扩展的布尔模型集合论代数扩展的向量空间隐性语义索引神经网络语言模型推理网络信念网络概率基于本体论的模型人工智能布尔模型(BooleanModel)布尔模型最早的IR模型,也是应用最广泛的模型目前仍然应用于商业系统中Lucene是基于布尔(Boolean)模型的布尔模型描述文档D表示一个文档被表示为关键词的集合查询式Q表示查询式(Queries)被表示为关键词的布尔组合,用“与、或、非”连接起来,并用括弧指示优先次序匹配F一个文档当且仅当它能够满足布尔查询式时,才将其检索出来检索策略基于二值判定标准算法R根据匹配框架F判定相关举例Q=病毒AND(计算机OR电脑)ANDNOT医文档:D1:…据报道计算机病毒最近猖獗D2:小王虽然是学医的,但对研究电脑病毒也感兴趣…D3:计算机程序发现了艾滋病病毒传播途径上述文档哪一个会被检索到?