文档介绍:理解大数据,实践大数据
内容
对大数据的理解
拓尔思大数据产品布局和应用实践
反对派认为,我们现在处在一个盲目的大数据崇拜时代
大数据产生的背景
数据的爆发式增长和社会化趋势,新摩尔定律
大数据已经成为一种自然资源
机器数据日益重要
大数据不被利用就是成本
大数据产生的背景
现有的商业软件难以处理大数据的规模和复杂性
 获取(capture)
存贮(storage)
搜索(search)
分享(sharing)
分析(analysis)
可视化(visualization)
奥巴马大数据战略
2012年3月29日,白宫发布美国政府的大数据计划
通过提高从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究
大数据的4V特性
体量Volume
多样性Variety
价值密度Value
速度Velocity
非结构化数据的超大规模和增长
总数据量的80~90%
比结构化数据增长快10倍到50倍
是传统数据仓库的10倍到50倍
大数据的异构和多样性
很多不同形式(文本、图像、视频、机器数据)
无模式或者模式不明显
不连贯的语法或句义
大量的不相关信息
对未来趋势与模式的可预测分析
深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)
实时分析而非批量式分析
数据输入、处理与丢弃
立竿见影而非事后见效
对大数据的理解
大数据比云计算更为落地
大数据不仅仅是“大”
软件是大数据的引擎
大数据的应用不仅仅是精准营销
管理大数据“易”,理解大数据“难”
1、大数据比云计算更为落地
商业模式驱动
应用需求驱动
云计算本身也是大数据的一种业务模式
2、大数据不仅仅是“大”
多大?
PB 级
比大更重要的是数据的复杂性,有时甚至大数据中的小数据如一条微博就具有颠覆性的价值