文档介绍:IBM 大数据平台解决方案介绍
Dalian, 11 March, 2013
Xiao Fei Wang
1. 项目背景理解
IBM 大数据平台解决方案
当前业务面临的挑战
数据问题
慢
缺
重
散
繁
差
企业内数据定义缺失;数据项缺失;数据属性不完整;
企业外部数据无暇顾及;
数据在多个系统中重复采集、重复存储;
系统数据无法关联、共享,数据整合困难;系统林立,数出多门;
数据时效性差,使用者无法及时获得所需信息;
数据使用不方便,方法繁琐;手工报表多;
数据质量差,数据不完整,数据不一致;
业务支持
Text
Text
网络运营
决策与报告
风险管理
产品运营
营销支持
精细化
管理
对运营商价值链的影响
数据问题长期存在将导致:
对自身状况摸不透对经营环境看不清
对市场先机抓不住对未来竞争赢不了
制约
阻碍
没有准确数据支撑
难以进行深度分析
决策缺乏可靠依据
IT如何推动公司运营变革
2、服务管控模式逐步完善
夯实基础管理
管控思路由简单支撑向精细服务转型
全面优化信息化服务流程实现分级服务
保险行业经过多年的发展,整个行业的变革越来越快,市场竞争环境也日益激烈。保险公司想要在残酷的竞争中占得先机,就必须考虑产业的融合,并在价值链中占得有利的位置。
1、由被动的IT支撑向主动的以数据为核心的IT服务转型
以大数据为核心组织IT服务能力
持续完善基础支撑能力
拥抱互联网
架构体系全面云化
大数据思考
根据Gartner的定义,大数据的特征具体涵盖了3V的内容:
数据量庞大(Volume):从PB扩展到ZB;IT系统、互联网、物联网等每天都在产生大量新生数据,过去的两年间产生的数据占到了所有数据的90%
数据变化快(Velocity):数据变化与处理的频度由天加速到秒/毫秒;订单、支付、欺诈、微博、监控视频、传感器、信令每时每刻都在不停的产生数据
数据多样(Variety):数据种类繁多:数据库表,格式文本,自然语言文本,电子表格,声音,图片,视频……
数据规模大
数据范围广
数据加工深入
数据服务对象全面
数据类型多
数据管理复杂
生产系统数据
网元等设备数据
平台自生数据
外部互联网数据
……
10PB级+
指数级快速增长
结构化、非结构化
静态、动态
……
在线、近线、离线
高性能、低成本、高质量、可追溯
……
企业内部(管理层、执行层、一线营销群体等)
企业外部(客户,合作伙伴,供应链、政府部门等)
内部生产系统
……
信息转换
知识沉淀
价值创造
……
数据成为公司核心资产和核心竞争力,将被设计用于在成本可承受(economically)的条件下,通过快速(velocity)采集、发现和分析,从大量化(volumes)、多类别(variety)数据中提取价值(value)
大数据应用价值可以从公司侧和客户侧体现
客户:
精准服务
及时响应
智能应用
透明管控
围绕大数据应用,促使公司实现科学运营、价值创造以及透明管控,一方面能使得公司侧感知到大数据带来的管理、决策、运营效率和质量的提升;另一方面,能够使客户感知到大数据带来业务开发的智能、服务及时以及与需求匹配的精准。
科学运营
价值创造
企业:
开发便捷
分析及时
决策支持
数据准确
…
大数据平台
客户
2. 大数据平台需求理解
IBM 大数据平台解决方案
大数据平台的关键需求
角色
流程
数据应用
数据分类
市场营销
产品开发
客户管理
客户洞察
……
决策类活动
管理类活动
执行类活动
分析类活动
结构化了企业架构中四大架构的关键要素,以及要素间的承接关系,形成了一套规范、清晰的定义,从而为大数据平台的方案设计建立了更明确的指导依据和验证方法。
柔性架构的大数据平台
企业架构方法论和云计算技术让建立柔性架构成为可能,基于企业架构元模型,建立柔性的架构需要实现业务、应用、数据、技术四个架构层面的解耦。
业务—应用/数据:业务活动在业务架构和应用架构(大数据平台)间具有承上启下的作用,可从业务类型和业务活动类型两个维度划分,前者体现业务差异,后者更多体现数据平台能力要求,且可以稳定地分为决策类、管理类、执行类和分析类四种,因此业务与IT的解耦可从四类业务活动支撑实现。
应用—数据:应用和数据共同承接了业务,数据实体也承接了应用交互,因此二者解耦的核心是数据实体。这可以通过建立稳定的、弹性的企业企业级大数据模型、数据整合与存储区域,保证未来应用对数据操作的可扩展,以及屏蔽了应用对底层数据直接访问的数据服务加以实现。
应用/数据—技术:系统组件承接了应用和数据,因此要实现该层面的解耦,需要解决系统组件对应用