1 / 4
文档名称:

搜索引擎之倒排索引:产品经理需要了解的搜索算法.pdf

格式:pdf   大小:212KB   页数:4页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎之倒排索引:产品经理需要了解的搜索算法.pdf

上传人:学习好资料 2022/1/10 文件大小:212 KB

下载得到文件列表

搜索引擎之倒排索引:产品经理需要了解的搜索算法.pdf

文档介绍

文档介绍:搜索引擎之倒排索引:产经 品 理需要了解的搜索算法 
 互联时 网 代,信息 纷 繁海量,人 们过 通 搜索引擎直达“心中所想”已是常态么 。那 搜索引擎
到底是如何高效查标 找目 内容呢?本文主要介 绍 搜索引擎里一个比 较 重要的 结 构——倒排
索引。 
1 倒排索引简 介 
倒排索引(英文:Inverted Index),是一种检统种 索引方法,常被用于全文 索系 中的一
单词文档映射 结 构。 
现绝代搜索引擎 大多数的索引都是基于倒排索引来 进这实际应 行构建的, 源于在 用当中,
用户查时输关键户记 在使用搜索引擎 找信息 往往只 入信息中的某个属性 字,如一些用 不 得
歌名,会输词查 入歌 来 找歌名; 输 入某个 节 目内容片段来 查该节 找 目等等。 
面对 海量的信息数据, 为满户顺应时 足用 需求, 信息 代快速 获 取信息的 趋势聪开发 , 明的
者们 在 进 行搜索引擎 开发时对这 些信息数据 进 行逆向运算,研 发 了“关键词——文档”形式
的一种结实现过 映射 构, 了通 了物品属性信息 对进 物品 行映射,可以帮助用 户 快速定位到
目标获难 信息,极大地降低了信息 取 度。倒排索引又叫反向索引,它是一种维 逆向思 运算,
是现检领 代信息 索 域里面最有效的一 种结 索引 构。 
2 倒排索引&FAQ 
从用户请结许对 求到 果返回, 多朋友会 倒排索引在 检统过产 索系 中的工作 程 生好奇,本小
节就倒排索引的一些常 规认识 ,有如下 问题 : 
Q1:何为么 索引?倒排索引又是什 ? 
索引,是为查过标预创种储结 了加快信息 找 程,基于目 信息内容 先 建的一 存 构。例如:一
本书录论读 ,没有目 ,理 上也是可 的,只是当你合上当前在 读时开书 的内容 ,下次再翻 本
去查 找,就比 较 耗 费时间 了。如果增加几 页 目 录 ,我 们 可以快速地了解 书 本的大体内容分
布,以及每节页 一个章 面位置的分布情况,这样 我 们查询 内容的效率自然就会提高。 书 的
目录 ,就是 书 本内容一 种简单 索引。 
倒排索引,是索引技术 中的一 种