文档介绍:
阿里云的数据三部曲
被数据流通和应用所改变的用户们。
2016年1月,阿里云在云栖大会上海峰会首次公布全面的大稻菡铰院鸵徽臼酱笫据平台“数加”。当时,参会者在展区围住阿里云数据业务部高级专家陈鹏宇,甚至有企业在现场直接拉群,邀请陈鹏宇入群探讨数据业务。
陈鹏宇2010年加入阿里巴巴,从负责蚂蚁小贷业务的大数据技术开始,在早期就参与了阿里大数据业务的发展过程。在阿里云公布大数据战略一年多后,陈鹏宇总结企业用户在大数据实践中的“三部曲”:看数据、用数据和跨行业打通数据。
“看数据”要像“看电视”
“Data ,这是大部分企业的基本刚需。”陈鹏宇说。虽然看数据的传统BI工具已发展多年,但对企业老总和业务人员来说,看数据仍然不是一件简单轻松的事。这是因为传统BI都太复杂,企业还要花大量时间来解决数据孤岛问题。
“现在有了云,数据采集后直接上云,天生就能融合在一起。只要有合适的工具,就能让看数据变得简单”。
阿里推出了看数据的工具Quick BI,突出“快”。它的理念是,老板和业务人员有需求,不再需要传统上分析师转化需求和数据工程师准备数据的过程,不用写代码,可直接连上云端的各种数据库,用户“拖拖拽拽”就能产生各种数据报表。而之前,“看数据”的响应周期是以周来计算的。
“我们希望今年把Quick BI做成阿里云的标配,就好比每家每户都有电视机一样。”陈鹏宇说。
在“看数据”上,阿里云还有一种大屏产品DataV,据说这是阿里云上生意极为兴隆的业务之一。它是一种软硬结合平台,无论阿里自己的日常业务展示、“双十一”大屏展现,还是长江三峡工程、杭州城市数据大脑中都有这种大屏的身影。
今天在数加平台上有3万个大屏模板,都是客户设计分享出来的。“我真的没有想到,它很快就成了一个爆款。”陈鹏宇说。
机器学****不高深”
到了Data ,数据要直接为业务所用,就像创新小贷业务,没有信贷员,用数据决策贷款发放。“数据+算法就能解决业务问题。”陈鹏宇说,“其中最关键的是算法效果,这方面的人才很缺,我们叫他数据科学家。”
陈鹏宇观察,目前市场上需求强劲的是个性化推荐。但以前只有淘宝、亚马逊这些大公司才能玩,因为要写算法、要有庞大的计算资源反复训练模型。
中小电商、新闻网站、音乐社区能不能达到千人千变的效果?现在,阿里团队把推荐算法和数据处理过程包装起来,用户只要按预定格式输入三类数据――脱敏客户信息、物品信息及客户和物品之间的历史行为,就可以得到推荐结果。
在新闻推荐上,陈鹏宇坦言《今日头条》做的推荐算法不错。“这要对新闻做比较完整的画像,与商品推荐不同,要通过自然语言处理,提炼出新闻内容的关键词”。
不难想象,推荐算法用到了机器学****但这是一般企业都不敢碰的高深技术,同时还需要大量计算资源――一个个性化推荐算法,模型训练周期很长,可能要跑好几天。为此,2015年阿里云推出了机器学台PAI,。它把机器学****算法封装好,将成百上千的参