1 / 29
文档名称:

淘宝商品管理·技术实践之路.pdf

格式:pdf   页数:29
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

淘宝商品管理·技术实践之路.pdf

上传人:紫岑旖旎 2012/8/21 文件大小:0 KB

下载得到文件列表

淘宝商品管理·技术实践之路.pdf

文档介绍

文档介绍:淘宝网商品管理
技术实践之路
About Me
淘宝网-产品技术部
交易平台-商品平台-商品管理
姓名:刘抚狄
花名:府笛
***@TB府笛
内容提要
技术挑战
商品管理系统的演化过程
技术细节
展望
技术挑战@淘宝商品管理
十亿级商品数
百万级用户数
每天处理TB级数据
数据沉淀
成本控制
业务多变
上千条业务规则
发展过程@淘宝商品管理
模型全量模型数据工具
人肉搜索引擎全量规则·模型增量·优化
商品生命周期
第一阶段:基于搜索
商品后台商品主搜
规则库商品库
基于搜索的商品管理
〙实现
存储用户设置的规则,生成Query
定时仸务触发,多进程/线程执行
〙特点
作为搜索的子集,所见即所得
方案简单,快速满足需求
第一阶段:改进
〙翻页查询,时间长,成本高,引擎鸭梨山大
〙索引优化、预排序导致的截断,数据丌全
〙指标有限,在丌影响主流业务的情况下难以扩展
〙更换数据源,思考如何才能进行全量管理
〙开始考虑引入模型和算法资源,降低人肉成本
第二阶段:全量
模型商品卖家交易浏览投诉……
Hadoop/宽表Join
Job端·模型&执行引擎
规则库商品后台商品主搜
实时端模型&执行引擎商品库
基于Hadoop的全量商品管理
〙实现
全量部分:Hadoop + 宽表+ DSL
实时部分:Notify(MQ) + DSL + 实时构造宽表
保留搜索引擎逡辑
〙特点
全网所有数据都在全量覆盖范围
术业与攻,发挥BI、网安、反作弊等团队技术优势
大量使用在搜索引擎中丌提供的指标
更好的发挥DW、BI资源作用
能够实现较为复杂的业务逡辑