1 / 42
文档名称:

淘 宝云梯分布式计算平台整体架构.pdf

格式:pdf   大小:9,568KB   页数:42页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

淘 宝云梯分布式计算平台整体架构.pdf

上传人:cjl201702 2021/7/29 文件大小:9.34 MB

下载得到文件列表

淘 宝云梯分布式计算平台整体架构.pdf

文档介绍

文档介绍:淘宝云梯分布式计算平台整体架构
淘宝数据平台与产品部
云铮

淘我

欢!
目录
系统架构
数据同步方案
调度系统
元数据应用

淘我

欢!
系统整体架构

Oracle 备库 MySQL 备库 日志系统 爬虫数据
Gateway Servers

DataExchange DBSync TimeTunnel

云梯 1 据
天网调度系统

Map Reduce Streaming Hive Jobs 向
Java Jobs Jobs
数据平台 搜索 广告 BI 支付宝 口碑 B2B 云梯 2
数据魔方 量子统计 淘数据 推荐系统 搜索排行 …

淘我

欢!
淘宝云计算介绍

淘我

欢!
数据同步方案 ——概览
数据源 增量实时同步 Hadoop集群 计算结果
Mysql备库 Dbsync
Mysql
全量 /非实时同步
oracle备库 TimeTunnel 2
HDFS DataX
日志数据 全量 /非实时同步 oracle
爬虫数据 DataX