文档介绍:统一系统监控项目
项目启动会议
议题
项目团队与实施计划
项目背景与项目范围
项目实施方法论及交付件
项目管理方法
项目背景
经过多年的发展,上海大众IT建设已日渐完善。但为了更好的确保业务的连续性,提升IT运维和服务能力成为当前重要任务。上海大众需要一个面向业务的性能保障机制,选用业界领先的软件产品,搭建统一的系统监控平台。保证业务的持续性,来充分支持企业的产销量、盈利、质量和用户满意度。
通过IT系统监控平台,IT部门的管理模式转变到以应用业务SLA和客户性能体验为中心,实现对业务应用的端到端的监控。围绕着业务和客户体验,实现一个数据中心层面的实时监控,及时预警,快速的问题源分析和定位,深入地性能诊断的服务保障流程。
项目目标
IT基础资源层面的监控
实现对 IT 基础资源,包括服务器、操作系统、数据库、中间件的监控
对网络设备的自动发现、网络事件和性能的监控
应用层面的监控
用户体验管理:通过模仿客户访问应用主动的探测应用的可用性以及性能,目的是争取先于客户发现问题
被动的检查客户体验:通过监控真实的用户交易获知用户的使用感受,目的是获知真实用户的使用情况
端到端交易跟踪:通过端到端的交易跟踪,目的是隔离问题和缩短问题定位时间
业务层面的监控
通过业务服务模型的构建查看业务应用
对于整体业务运行的可视性:通过业务应用的纵览图,获取业务层面的运行状况
项目实施的范围
通过统一的监控平台实现对网络设备的自动发现,网络事件和性能的监控、协议分析
Zabbix开源监控系统,Zabbix系统只对操作系统进行监控管理
实现对 IT 基础资源,包括服务器、操作系统、数据库、中间件和商业应用的监控
实现对EP、SAP ECC、ASMP、OPCS、Exchange、TAM和 AD七个关键应用的监控管理
事件集成:包含IBM DIRECTOR,HP SIM、EMC ECC、Oracle Grid control、SAP Solution Manager、Zabbix和机房环境监控
集成上述IM和APM的监控,建立业务模型(服务目录树)
构建基本的流程管理,定义基本的报警处理规则
统一系统监控遵循集中监控、分散管理的设计原则,分别对网络基础架构监控IM、应用性能管理APM、统一监控平台SOI进行实施
项目指导委员会
(×××××)
项目经理(××)
网络管理员(××)
运维部门(×××)
系统管理员(××)
应用管理员
(××××)
项目经理(××)
架构师(××)
APM工程师(孙××、孙××)
SOI工程师(黄×、×)
IM工程师(黄××)
开发工程师(××)
项目团队组织架构
测试工程师(曹××)
职务
姓名
职能描述
项目经理
××
日常项目管理工作(如范围、质量、人力、风险等方面的管理)
定期会议组织及工作汇报
重大问题的紧急联系人,资源协调
内外部沟通和激励,及时发现和处理问题,推进团队合作
架构师
李×
负责项目整体技术的需求调研、架构设计及功能验证
交付件质量管理
获取客户技术需求,解决技术问题
实施工程师
×××
负责实施技术工作
负责应用集成方案的具体的实施
协调和沟通获得技术支持
实施工程师
××
负责代码开发
负责接口开发
运维工程师
××
负责系统日常运行维护工作,协助系统管理员处理日常问题
乙方项目组成员及职责
需求分析、功能设计
ASMP应用实施
系统安装、配置、定制
上线试运行
验收
测试
启动
2013/03
2013/06
培训及项目管理
2013/08
2013/09
项目进度计划概览
培训
项目里程碑(二)
基础架构性能(IM)
网络管理、系统管理满足需求,性能分析报表满足需求,流量分析针对7个应用满足需求。
应用性能管理(APM)
客户体验部分,CEM,ADA,模拟拨测的安装和定义,包括网络镜像流量的设备和规则定义
应用监控,应用组件性能,,MQ,SAP,数据库性能的监控的配置和验证
监控界面,报警,报表等定义,满足运维对该应用的监控日常需求
统一事件平台(SOI):
IM,APM,Scom,Oracle OEM的集成
Zabbix,SAP SM, IBM Direct,HP SIM,ECC,机房环境平台的报警集成
服务模型树,以ASMP为样例,验证模型树中的关键信息节点,服务影响规则等
运维流程的验证,结合ASMP体现SOI,APM,IM以及其他系统监控集成后的运维流程
SLA报表的验证
需求和设计说明书交付件