1 / 7
文档名称:

产品经理需要了解的搜索算法.pdf

格式:pdf   大小:214KB   页数:7页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

产品经理需要了解的搜索算法.pdf

上传人:流金岁月 2021/6/8 文件大小:214 KB

下载得到文件列表

产品经理需要了解的搜索算法.pdf

文档介绍

文档介绍:产经品 理需要了解的搜索算法 
 1 倒排索引简 介 
  
倒排索引(英文:Inverted Index),是一种检统种 索引方法,常被用于全文 索系 中的一
单词文档映射 结 构。 
  
现绝代搜索引擎 大多数的索引都是基于倒排索引来 进这实际应 行构建的, 源于在 用当中,
用户查时输关键户记 在使用搜索引擎 找信息 往往只 入信息中的某个属性 字,如一些用 不 得
歌名,会输词查 入歌 来 找歌名; 输 入某个 节 目内容片段来 查该节 找 目等等。 
  
面对 海量的信息数据, 为满户顺应时 足用 需求, 信息 代快速 获 取信息的 趋势聪开发 , 明的
者们 在 进 行搜索引擎 开发时对这 些信息数据 进 行逆向运算,研 发 了“关键词——文档”形式
的一种结实现过 映射 构, 了通 了物品属性信息 对进 物品 行映射,可以帮助用 户 快速定位到
目标获难种维 信息,极大地降低了信息 取 度。倒排索引又叫反向索引,它是一 逆向思 运算,
是现检领 代信息 索 域里面最有效的一 种结 索引 构。 
  
2 倒排索引&FAQ 
  
从用户请结许对 求到 果返回, 多朋友会 倒排索引在 检统过产 索系 中的工作 程 生好奇,本小
节就倒排索引的一些常 规认识 ,有如下 问题 : 
  
Q1:何为么 索引?倒排索引又是什 ? 
  
索引,是为查过标预创种储结 了加快信息 找 程,基于目 信息内容 先 建的一 存 构。例如:一
本书录论读 ,没有目 ,理 上也是可 的,只是当你合上当前在 读时开书 的内容 ,下次再翻 本
去查 找,就比 较 耗 费时间 了。如果增加几 页 目 录 ,我 们 可以快速地了解 书 本的大体内容分
布,以及每节页 一个章 面位置的分布情况, 这样们查询 我 内容的效率自然就会提高。 书 的
目录 ,就是 书 本内容一 种简单 索引。
倒排索引,是索引技术 中的一 种 ,它是基于信息主体的 关键 属性 值进 行构建的。如下 图 1: 
  
  
  
图 1 倒排索引概念示例图  
  
假设检 索系 统 中只有一个商品——衣服 A