文档介绍:大数据时代读书报告
导读:就爱阅读网友为您分享以下“大数据时代读书报告”资讯,希望对您有所帮助,的支持!
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。《大
数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过
对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出
现的问题提出自己看法与对策。下面来重点介绍《大数据时代》这本书的主要内容。《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成
功的预测了2009年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的
预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关
的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据
的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大
数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,
维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时
候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本<总
体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处
理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现
使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方
式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基
础之上的。
接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有
出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google
词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google
的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数
据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不
管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量
的数据也会无限的逼近事物的原貌。之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数
学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。
换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一
群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克
托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这
一些人是否合法的获得与应用数据,是否侵犯了个人隐私。无论如何,大数据时代将会到来,不管我们接受还是不接受! 而且这两年,大数据这个词突然变得很火,不仅出现在阿里巴巴、谷歌等互联网公司的
战略规划中,同时在我国国务院和其他国家的政府报告中多次提及,无疑成为当今互联网世
界中的新宠儿。我对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完《大数据
时代》才有了粗略的认识。我侧重于从第一部分中的这三个观点谈谈自己的看法,这三个观点可以说是哲学上说的
世界观,这三个观点可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点
对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,
由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得
海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。
作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相
扑”等来证明使用全体数据的重要性。这个观点足以这个观点足以引起统计学乃至社会文明
的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对
这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自
然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代
要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比
如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产
物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%