文档介绍:NurfürdenpersönlichenfürStudien,Forschung,:GrowingIO联合创始人吴继业数据像水一样,而水滋润万物,帮助万物生长。GrowingIO这个名字诠释了生长,数据和循环。我希望数据能像水一样在企业内部流动,可以帮助到每个人。Datatothepeople。一、为什么要进行数据分析?我毕业的时候,正好赶上了数据仓库迅速发展的好时候,大学的时候喜欢数据库,很自然的就入了这行。入行后我发现企业有很多的数据孤岛,很多的数据不能统一在同一个地方以供分析。我的工作就是将不同数据源的数据整合起来,设计数据仓库模型,开发数据处理、数据清洗的任务,定时调度ETL(数据抽取,数据转换,数据装载)的任务,制作报表,准备数据挖掘的Training数据。这些数据准备的工作都是为了解决以下这些问题。“公司有堆积如山的数据,可是就是不能访问。”“我们需要以各种方式随心所欲地切割数据。”“如何让业务人员能够简单快捷地得到所需形式的数据?”“我只想看到最重要的内容,能指导我决策。”“为什么在开会的时候两个同样的指标,却相差如此之大,背后的计算逻辑到底是什么?”“我们希望员工用事实依据和数据来支持决策的过程!”“用历史数据来预测用户的倾向,从而增加转化率!”二、数据驱动增长的亲身经历曾几何时大数据这个词出现了,技术的发展是为了适应数据在这几年里疯狂的增长。我们不需要说明我们今天要分析的数据有多大。很多企业都有大量的数据。我们要解决的问题是可以多快的准备好数据并用于分析。新的技术不断涌现,storm,spark,tez,impala,presto,tajo,flink。不变的什么?还是上面这些问题。在LinkedIn我们非常成功的解决了这些问题。Simon,我在Linkedin的领导,也是GrowingIO的创始人和CEO,有一个三年计划,第一年全面自动化,第二年数据挖掘,第三年全面用数据分析支持公司各大业务部门实现商业决策。最初三年里我们全面支持了LinkedIn的销售,产品,市场,运营和客服部门。我们做的数据分析内部网站每天都有很多的内部员工在用,一旦宕机立马被叫醒去修复。离开LinkedIn的那天,一起工作过战斗过的同事为我们送别,我哭了,被团队感动了。从LinkedIn出来,我发觉每个企业都需要数据处理和分析服务,我们用SaaS服务解决企业的数据采集,整合,清理,分析的问题,我们想把这个流程自动化,为企业提供云端服务。让互联网企业能够在几分钟内就可以分析自己的业务。三、如何破解传统BI的弊端?,是数据分析的第一步。互联网和移动互联网的数据是我们关注的重点。需要不不同的数据源同的技术手段去采集数据,比如网页端的,iOS和Android。目前大部分的数据采集的模式都是埋点采集的模式,就是需要什么数据点就埋什么数据点。往往存在的问题是业务人员和分析师定义要什么样的数据,然后由程序员来埋点实现。程序员的主要职责是负责开发产品的功能与埋点做数据监控,但埋点不是他们工作的重点,业务人员和分析师的工作重点是关心产品的用户体验,而不是像技术人员那样改代码埋点。GrowingIO想推出的SAAS服务