文档介绍:别被大数据迷了眼睛
不消说,大数据是现在IT领域最热的词汇,而且,它的热度已经超出了IT领域。
大数据,将改变企业的营销方式,精确分析客户行为;将改变企业的运营管理方式,辅助企业决策,预测风险,提升效率……
且别被大数据迷了眼睛
不消说,大数据是现在IT领域最热的词汇,而且,它的热度已经超出了IT领域。
大数据,将改变企业的营销方式,精确分析客户行为;将改变企业的运营管理方式,辅助企业决策,预测风险,提升效率……
且慢。在为大数据树碑立传之前,需要先考察一下大数据所谓何物。
IT领域从来都不缺概念,无论是3V还是4V的大数据属性,新概念一出,就会有人想当然地、在没有经过深入的思考和考证之前,表现出对新概念的认同。
不可否认,移动互联网、社交网络、物联网让人类社会的数据量大幅增长,然而,这就是大数据吗?在大数据的概念出现之前,就没有客户分析,没有辅助决策、风险预测吗?在大数据的概念出现之前,相对于我们的数据处理和分析能力,我们所拥有的数据就是“小数据”吗?
显然,答案是否定的。
数据挖掘和数据分析并不是新的学科,我们在这一领域拥有很多成熟的技术。笔者以为,今天所讲的大数据,正是对数据挖掘和分析的不断完善和提高,将更多的非结构化、半结构化和流数据引入数据挖掘和分析的领域,而不是另起炉灶,并为其赋予一个似是而非、含混不清的名词——大数据。
大数据能够被热烈地讨论,是因为其在精神层面上满足了人们对未知事物的好奇心,在物质层面上有Hadoop、NoSQL这样实实在在的技术作为支持。实际上,如果能够厘清大数据的概念,把大数据定位为对传统数据挖掘和分析的提升,那么就可以很容易地认识到,Hadoop、NoSQL并不是大数据的全部。
Teradata的CTO宝立明就认为,H