1 / 19
文档名称:

淘宝数据分析挖掘实践及变革.pdf

格式:pdf   页数:19页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

淘宝数据分析挖掘实践及变革.pdf

上传人:xwhan305 2014/10/20 文件大小:0 KB

下载得到文件列表

淘宝数据分析挖掘实践及变革.pdf

文档介绍

文档介绍:淘宝数据分析挖掘实践及变革
毛波 2013-04
目录
•淘宝数据四阶段
•系统变迁及平台架构
•数据应用格局
•新的探索
•一些观点
淘宝数据四阶段
•被动响应
–2007年前
•主动变革
–2008-2010
•优化完善
–2011-2012
•引领驱动
–2013-
系统变迁及平台架构
数据系统变迁
2013-
2011-2012
数据驱动
Hadoop集群
新模式探索
2008-2010 公有云
DXP
Hadoop集群实时Storm
调度监控调度监控
年前
2007 实时日志传输实时日志传输
数据库集群
( ) 数据门户实时数据库同步
脚本
多维分析数据门户
简单调度
自助查询工具
数据报表
元数据管理
数据系统变迁
数据
•性能量

•扩展性技术
方案
业务
资源
•运维需求
数据平台架构


数据门户多维自助查询平台在云端接入数据魔方量子恒道 OpenAPI 应


分布式集群实时计算


Storm

DXP 计
Hive Hbase 数据交 Ocean 冷数据算
换平台 Base 集群…平



HDFS


控数

DataX DBSync TT 据




业务库(Mysql) Log Server ……外部数据据

数据应用格局
对外数据产品
•数据魔方/淘宝指数
–行业趋势
–人群特征
–成交排行
–市场细分
•量子恒道
–销售分析
–营销效果
–来源分析
•搜索排行榜
对外数据产品
•淘宝时光机
–http://me./
–回忆的感动
•排行榜