文档介绍:大数据时代——数据分析在路上
[英] 维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger)
[英] 肯尼思库克耶(h) 著
2013-5-16 Leven
书评:
正如书的标题 A revolution that will transform how we live,work,and think 所说
一样,大数据时代已经到来,它正悄悄改变我们生存的环境,不断地从商业、学习、生活等
各个角度影响我们的行为方式,在这个快速且复杂变换的信息时代,我们需要一个更精准的
方法去决策人们的行动,大数据正在以划时代意义的让人们崛起,构造一种全新的思维模式,
做更好的决定。
接收新的理念,那就是从因果关系到相关关系的思维变革,建立在相关关系分析法基础上
的预测这是大数据的核心。可能我们暂时无法理解全体数据而不是样本数据的处理方法;不
能理解要效率而不是绝对精准的处理理念;更不能接受不追求因果这个决定性的关系而去寻
找相关关系的处理导向;《大数据时代》能告诉你为什么我们要有这样的转变,而这样的转
变能带来多少好处,IBM、谷歌、亚马逊、阿里等这些商业巨头已经开始做了很多成功大数
据处理案例,他们引领我们走向崭新的大数据世界,你还在等什么,数据分析在路上(交流
群:158328722),我们晃晃悠悠!
序
大数据时代处理数据理念上的三大转变:
(1)要全体不要抽样
(2)要效率不要绝对精确
(3)要相关不要因果
努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,
就停下来。
引言一场生活、工作与思维的大变革
大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础
上是无法完成的。
大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一
种机器学习。
大数据的核心代表着我们分析信息时的三个转变:
(1)在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关
的所有数据,而不是依赖于随机采样。
(2)研究数据如此之多,以至于我们不再热衷于追求精确度
(3)第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系
第一部分大数据时代的思维变革
1. 更多——不是随机采样,而是全体数据
大数据与三个重大的思维转变有关,这个三个转变是相互关系和相互作用的:
(1)首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本
(2)其次,我们乐于接受数据的纷繁复杂,而不是追求精确性
(3)最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关
关系
随机采样不适合考察子类别的情况,因为一旦继续细分,随机采样结果的错误率会大大
增加。
全数据模式,样本=总体
多样性是有额外价值的
2. 更杂——不是精确性,而是混杂性
测量就是认知
错误并不是大数据固有的特性,而是一个需我们去处理的现实问题,并且有可能长期存
在。
要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的
清楚的分类被更混乱却更灵活的机制所取代了
在大数据里,宽容错误