1 / 21
文档名称:

数据中台介绍.docx

格式:docx   大小:371KB   页数:21页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据中台介绍.docx

上传人:niupai11 2022/6/8 文件大小:371 KB

下载得到文件列表

数据中台介绍.docx

相关文档

文档介绍

文档介绍:到底什么是数据中台?
导读:数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共 享,并在2018年因为“腾讯数据中台论”再度成为了人们谈论的焦点。在3月 15日ThoughtWorks技术雷达峰会上,关于数据中台的话题也获得了众多报表虽然能够提供部 分业务价值,但不能直接影响业务。
数据平台的出现是为了解决数据仓库不能处理非结构化数据和报表开发周 期长的问题,所以先撇开业务需求、把企业所有的数据都抽取出来放到一起, 成为一个大的数据集,其中有结构化数据、非结构化数据等。当业务方有需求 的时候,再把他们需要的若干个小数据集单独提取出来,以数据集的形式提供 给数据应用。
而数据中台是在数据仓库和数据平台的基础上,将数据生产为为一个个数 据API服务,以更高效的方式提供给业务。
数据中台应该具备什么能力?
大数据和人工智能大火之后这几年,很多人一直在提一个说法,那就是 “数据是新的石油”。但史凯的观点却有些不同,在他看来,数据不等于数据 资产,如果没有从业务的角度对数据进行规划,再多的数据也无法产生价值。
史凯认为数据中台最核心的一个关键组件是数据资产目录。“我们认为, 一个企业的数据要能够充分发挥价值,很重要的一个前提条件就是这个企业的 数据结构和数据资产目录是对整个企业开放的。所有人都能够通过这个资产目 录了解公司有哪些类别的数据、包含什么属性、源数据由谁管理,这样就可以 快速搞清楚这些数据是不是自己需要的。但数据本身可以不开放,因为数据是 有隐私信息和安全级别的。”
大企业内部业务众多,不同业务可能存在很多重复数据。所谓的数据资产 目录就是把数据的模型去重、归一、梳理,变成一个树状结构,这个树状结构 不直接对应数据库中的字段。以航空货运为例,其数据资产可能包括货机、客 运机的辅舱,一架货机就是一个数据资产目录的节点,而货机的各种属性(如 货机型号、空间大小、年份等)就是这个节点下面的数据模型。数据资产目录 做的事情就是从业务层面出发制定数据标准,将企业业务相关的数据资产模型 抽取出来,这跟后面用什么数据库去存储、用什么结构去存储、存成结构化还 是非结构化都没有关系。它相当于把企业的业务从数据层面做了一个梳理,用 数据的语言把企业的业务模型还原出来。数据资产目录做好之后,后面才是用 什么技术手段、从哪里提取数据来映射到这个数据资产目录。
除了开放,数据资产目录还应该具有标签描述、可检索,这样才能最大程 度地方便真正使用数据的人,以最快的速度找到他们需要的东西。
在ThoughtWorks提出的精益数据创新体系中将企业所需要具备的数据能 力概括为以下六种,具备了这六种能力,企业才具备成为数据驱动的智能企业 的基础,而这些能力的承载平台,就是数据中台:
数据驱动的智能企业
盛据資产的规划和伯埋 故据巒产的我最和存诵 故摇冕产的共享和协作
业的採叢和分折 散据脈势的枸律和治理 放据胆势卸庭董粗运背
Lean Date Innovation Archit?ett/FE
1•数据资产的规划和治理
做中台之前,首先需要知道业务价值是什么,从业务角度去思考企业的数 据资产是什么。数据资产不等同于数据,数据资产是唯一的,能为业务产生价 值的数据。 对于同一堆数据,不同业务部门所关注的数据指标可能完全不
同,怎么让各个跨域的业务变成统一的标准,就需要规划企业的数据全景图, 将所有有可能用上的、所有对企业有可能有价值的数据都规划出来,最终梳理 出企业的数据资产目录。在这个时候不需要考虑有没有系统、有没有数据,只 需要关注哪些数据是对企业业务有价值的。这一层不建议做得太细,太细就难 以形成标准,不能适用于多个场景了。数据治理是数据中台很重要的一个领 域,ThoughtWorks认为在现在业务边界消失、需求快速变化的情况下,企业需 要具备精益数据治理的能力 Lean Da ta Governance。传统的中心化、事前
控制式的数据治理方式,要改变为去中心化、事后服务式的治理方式。
数据中台的数据治理应该如何做
从"管控式倒“服务式"治理 、轻"标准,懂"场景 元数据驱动,从事前到事后

数据中台要为企业提供强大的数据资产的获取和存储的能力。
数据的共享和协作
企业的数据中台一定是跨域的,需要让所有的人都知道数据资产目录在哪 里。不能因为数据安全,就不让大家知道企业有什么数据。没有共享和开放, 数据没有办法流动起来,没有流动的话数据的价值产生的速度就会非常慢。所 以在数据安全的基础上,企业的数据资产目录要对利益相关者、价值创造者开 放,要让业务人员能够做到“ Self-Service"。
业务价值的探索和分析
数据中台不仅要建立到源数据的通路,还需要提供分析数据的