1 / 36
文档名称:

通用广告引擎的索引设计和性能优化.ppt

格式:ppt   大小:843KB   页数:36页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

通用广告引擎的索引设计和性能优化.ppt

上传人:taoapp 2022/8/7 文件大小:843 KB

下载得到文件列表

通用广告引擎的索引设计和性能优化.ppt

相关文档

文档介绍

文档介绍:通用广告引擎的索引设计和性能优化
阿里妈妈事业部
师陀
Agenda
背景
索引设计和实现
遇到的问题
下一步工作
性能优化过程
性能优化小结
Q&A
背景
广告引擎的基本状况
层级结构:
广告主->广告计划->广告商品-通用广告引擎的索引设计和性能优化
阿里妈妈事业部
师陀
Agenda
背景
索引设计和实现
遇到的问题
下一步工作
性能优化过程
性能优化小结
Q&A
背景
广告引擎的基本状况
层级结构:
广告主->广告计划->广告商品->竞价词
背景
广告引擎的基本状况
层级结构:
广告主->广告计划->广告商品->竞价词
广告查询流程
Query解析-> 倒排查询->过滤->算分->排序->拼装结果返回
背景
广告引擎的基本状况
层级结构:
广告主->广告计划->广告商品->竞价词
在线查询流程
Query解析-> 倒排查询->过滤->算分->排序->拼装结果返回
索引数据:
每天重建全量 + 实时更新增量
背景
一年前:
使用搜索引擎isearch的索引内核 + 自己开发的辅表结构
相对实现复杂,正排读接口不清晰
性能问题
重构:新的通用广告引擎(一期)
索引支持主辅表结构
只做广告引擎需要的功能
目标:性能和可维护性
索引设计
倒排:全量 + 增量
Payload字段可配置
增量的多级可回收内存池
索引设计
正排:主/辅表结构
多种值类型:bit/int8/int16/…/float/string
多种字段类型:单值/固定多值/变长多值
定长字段和变长字段的紧密存储
Package
表的关联
字段平铺
索引设计
正排:主/辅表结构
多种值类型:bit/int8/int16/…/float/string
多种字段类型:单值/固定多值/变长多值
Package
表的关联
字段平铺
索引设计
正排
多种值类型:bit/int8/int16/…/float/string
多种字段类型:单值/固定多值/变长多值
定长字段和变长字段的紧密存储
Package
表的关联
字段平铺
主/辅表 + keyId->docId的hash表 + DeleteMap
索引实现
索引实现
索引实现
索引实现
索引实现
其他
TableWriter的其他成员
DeleteMap
KeyIdHashTable
相关小工具:indexLibPrinter
遇到的问题(1)
Mmap的得失
天然的弱持久化方案
利用系统page cache管理数据局部性
遇到的问题(1)
Mmap的得失
天然的弱持久化方案
利用系统page cache管理数据局部性
脏页回写不可控
遇到的问题(1)
Mmap的得失
天然的弱持久化方案
利用系统page cache管理数据局部性
脏页回写不可控
短期解决方案***@:flush_mmap_pages=0
遇到的问题(1)
Mmap的得失
天然的弱持久化方案
利用系统page cache管理数据局部性
脏页回写不可控
短期解决方案***@:flush_mmap_pages=0
Page cache换入换出不可控
遇到的问题(1)
Mmap的得失
天然的弱持久化方案
利用系统page cache管理数据局部性
脏页回写不可控
短期解决方案***@:flush_mmap_pages=0
Page cache换入换出不可控
mlock:不符合极端情况的异常处理需求
遇到的问题(1)
Mmap的得失
天然的弱持久化方案
利用系统page cache管理数据局部性
脏页回写不可控
短期解决方案***@:flush_mmap_pages=0
Page cache换入换出不可控
mlock:不符合极端情况的异常处理需求
另外的解决方案:使用shm替换mmap,主动控制持久化和故障恢复
遇到的问题(2)
稳定性
每天build全量的过程牵涉的系统太多太复杂
故障恢复的能力需要加强
解决方案:索引重整 + 索引压缩
遇到的问题(2)
稳定性
每天build全量的过程牵涉的系统太多太复杂
故障恢复的能力需要加强
解决方案:索引重整能力 + 索引压缩
数据灵活性
跟分布式build的结合
批量更新能力
下一步工作
广告引擎设计时的各项指标优先级
稳定性
正确性
灵活性
问题定位能力
性能
下一步工作
一期的新引擎还是很像搜索引擎
dispatcher
searchNode
searchNode
searchNode
merger
下一步工作
dispatcher
searchNode
searchNode
searchNode
merger
分布式
引擎索引数据中心

最近更新

基于DEA方法的农地利用效率差异研究的开题报告.. 2页

基于COD水环境容量的流域生态补偿研究的开题报.. 2页

基于CAE的电机电磁设计系统研究与开发的开题报.. 2页

基于ARM的便携式流式细胞仪设计的开题报告 2页

有关个人职业规划模板汇总七篇 41页

基于.NET的气象业务服务平台构建的开题报告 2页

城镇化进程中四川省山丘区农村妇女就业转移研.. 2页

2024年少儿美术老师工作计划(精选6篇) 16页

2024年小马过河读后感范文 4页

2024年小雪节气优秀谚语 13页

文明宿舍申请书锦集六篇 16页

2024年小班阅读教案 51页

城市商业银行区域化发展研究的开题报告 2页

城乡配电网变压器经济运行的研究的开题报告 2页

城乡中学生语文素养差距的案例调查的开题报告.. 2页

垂直轴风力机非定常气动特性数值模拟的开题报.. 2页

2024年小班游戏妈妈的衣服教案 8页

地震沉积学在浊积岩储层识别中的应用探讨的开.. 2页

2024年小班教案汇编(9篇) 19页

2024年小班教案9篇(通用) 20页

地方财政资金绩效管理机制研究中期报告 2页

工作录取通知书模板 7页

直线的“到角”“夹角”公式应用剖析和三角形.. 3页

丰城市资源循环利用产业基地招商优惠政策 6页

六项纪律生活会个人发言提纲 2页

党支部增补委员的选票 2页

2万气柜橡胶密封膜更换 28页

自动卷边封罐机进给系统设计【含CAD图纸、说明.. 32页

EPS构件施工合同 4页

EORTC QLQ-STO22问卷中文版 1页