1 / 13
文档名称:

大数据时代的科学数据战略(卢东明).pdf

格式:pdf   页数:13
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据时代的科学数据战略(卢东明).pdf

上传人:翩仙妙玉 2012/6/25 文件大小:0 KB

下载得到文件列表

大数据时代的科学数据战略(卢东明).pdf

文档介绍

文档介绍:大数据时代的
列式数据库
卢东明
Sybase软件(中国)有限公司技术总监

新浪微博: Sybase卢东明
•  1992年加入 Sybase China
•  1994-2006年在硅谷 13年, 效
力 Sybase公司, 巴克莱资产
管理公司(BGI)
•  2006年回到 Sybase China
任技术总监
• 新浪微博: Sybase卢东明
• 微群版主: “列式数
据库”, “CEP”
2 – Sybase Confiden
al – October 22, 2011
Agenda
• 大数据有多“大”
• 大数据怎么“数”
• 大数据何以“据”
3 – Sybase Confiden
al – October 22, 2011
什么是 Big Data : 亚马逊新体验
1,当日推荐
2,其他搜索人后来买了那些东西
4 – Sybase Confiden
al – October 22, 2011 4
什么是 Big Data: 亚马逊购物新体验
3,希望购买列表
6,对已购买产
品作评价
4, 购买单
5,其他类似购物者还买了什么
5 – Sybase Confiden
al – October 22, 2011 5
社交媒体–大数据的下⼀波挑战
Twitter 和 Tweets
•  Twitter 有 2,000,000,000注册用户
• 每天新注册用户 450,000
• 用户每周更新 10 亿条 Tweets =
将近 亿条每天= 138888 条
每分= 1650 条每秒
• 有将近 52% 的用户每天更新消息
•  5% 的用户制造了 75% 的内容
•  24% 的用户每天会查看好几次
Twitter
• 下午 5 点时发推最容易被转发
•  Twitter 上每天有 16 亿将搜索,
每秒 18000 次
6 – Sybase Confiden
al – October 22, 2011
社交媒体–大数据的下⼀波挑战
使用方式
•  40% 的 Tweets 来自移动设备
•  50% 的用户使用超过 1 个
平台接入 Twitter, 比如通
过手机, iPad, 家里电脑等
•  81% 用户关注不到 100 人,
150 万用户关注超过 500 人
•  Twitter 上注册的第三方应
用有超过 100 万个, 每
秒产生⼀个新应用
•  61% 的 Tweets 是英语
7 – Sybase Confiden
al – October 22, 2011
社交媒体–大数据的下⼀波挑战
用户分布
•  70% 的 Twitter 用户是非
美国用户
•  46% 的用户是男性, 54%
的用户是女性
•  53% Twitter 用户没有小孩
, 有小孩的用户比例是 47%
• 英国网民 11% 使用 Twitter
•  30% Twitter 用户的家庭收
入超过 10 万美元
8 – Sybase Confiden
al – October 22, 2011
社交媒体–大数据的下⼀波挑战
Twitter 和品牌
•  43% 的 Twitter 用户关注⼀个
品牌(为了获取打折等信息)
•  75% 的 Twitter 用户有可能从
自己关注的品牌那里购买商品
•  67% 的用户愿意将自己关注的
品牌帐户推荐给其他人
• ⼀条推广的 Tweet ⼀天大概要
花费 120000 美元
• 财富 100 强公司里有 88 家每
天在 Twitter 上更新新闻
•  Twitter 估值达到了 80 亿美元
9 – Sybase Confiden
al – October 22, 2011
数据库市场的细分格局
传统行式数据库
内存数据库列式数据库
更多事务处理大数据、
复杂分析
OLTP 交易 OLAP 分析系统
业务
10 – Sybase Confiden
al – October 22, 2011