文档介绍:该【信息网络运行维护管理规范 】是由【花双韵芝】上传分享,文档一共【81】页,该文档可以免费在线阅读,需要了解更多关于【信息网络运行维护管理规范 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。信息系统运维事件管理规范
本规范适用于信息系统运维事件,包括对信息系统的使用咨询,系统故障,以及有
关业务应用的支持要求。
术语
术语讲解
岗位AB角
一个岗位安排两个人,其中一个主要负责,称为
A角,当A角不能够
履行职责时,由B角取代。
呼叫中心
接收用户运维央求的受理平台。
事件管理
和呼叫中心一起组成事件办理流程,有效解决各种
IT突发事件,
赶忙恢复IT服务。
配置管理
管理各IT财富系统(配置元素,配置项)的流程,包括相互间的关
联与依赖关系。
配置管理数据
对所有IT组件、组件的不相同版本和状态以及组件之间的互有关系
库
进行追踪、记录。
运维管理知识
操作指南,开发文档、技术文档、查收文档等技术资料的会集。
库
影响程度
问题造成对IT环境的影响范围,包括对其他IT系统,对有关人员
等。
优先级
问题需要找到解决方法和办理措施的紧急程度。
在各系统的系统故障分级中定义为一级故障的故障现象,均视为
重要故障
重要故障。
在各系统的系统故障分级中定义为二、三级故障的故障现象,视
一般故障
为一般故障。
本过程成立运维负责人、支持受理人、问题反响人、各系统管理岗,岗位成立AB
角,负责信息系统运维事件的管理,详细职责要求以下:
序号角色名称定义/职责
全面负责运维各项工作。
审察审批各项运行保护制度规范和工作流程,负责协调各部门间的工作。
负责与其他部门间的协调工作。
负责成立健全本级运维与上级运维部门、本级运维与下级运维之间高级技术支持之间的顺畅沟通体系。
负责本级运维队伍的管理、培训工作。
负责落实上级运维部门提出的运行保护任务。
。
经过呼叫中心事件管理报告,监控事件管理的效率,改进运维服务质量。
负责系统重要故障及紧急事件的办理,并负责组织进行有关事故原因的检查解析,形成事故解析报告和相应的解决方案。
在业务部门,信息中心领导,以及信息中心内部保持优异的沟通渠道。
完满和保护事件管理系统。
负责接收用户反响的信息系统问题,并对问题记录、整理。
负责对事件分类和供应初始的支持。
将问题的解决步骤文档化。
支持受理人
将服务央求分配给合适的工作组。
追踪服务央求的办理过程以保证在规定的时间内解决问题,同时在系统里更新相应信息。
对于无法解答的技术问题,及时转送其他有关人员;
序号
角色名称
定义/职责
对于无法解答的业务问题,及时提走运维负责人。
7.
与服务央求的提交者进行直接的沟通,通知事件的处
理情况。
8.
在结束事件从前要确认服务央求的提交者对事件的解
决过程及结果可否满意。
9.
作为事件的责任人,监控,追踪所有的事件办理过程,
并作为和客户沟通的唯一联系点。
10.
编制管理信息报告。
1.
对于本级运维解决有困难的问题,负责向上级运维中
心、高级技术支持或国家电网运维部门及时正确地上
报。
、重要故障问题,负责向上级运维中心、高级技术支持或国家电网运维部门及时正确地上报。
负责全程配合、协助国家电网解决上报问题,并追踪问题的进展、解决、落实过程。
在规定的时间内解决服务央求。
对利用“临时方案"解决的服务需求,在资源及时间赞成时应找到问题根源。
在需要时(有重要故障及升级需求时),及时利用其他
4系统管理员资源(开发商或供应商)帮助用户解决问题。
将服务央求的解决方案的步骤文档化,并录入系统。
更新文档记录。
和主机管理人、储藏管理人、数据库管理人、中间件管理人一道,对业务系统推行全方向的管理。
参加事件管理、服务央求管理、重要故障办理、事件升级、一般事件办理、服务报
告管理流程涉及的系统运维工作。详细工作内容以下:
事件管理
运维事件管理的整体流程如图1《问题响应管理整体流程》所示:
支持受理人接受来自各种渠道的服务央求、告警、故障事件等;
经过服务央求管理系统将事件进行记录、分类、确定优先级;
依照预定义的重要故障分类,判断可否启动《重要故障办理流程》(见图3);
如遇紧急事件,则直接履行《升级流程》(见图4),由运维负责人直接调用合适资源赶忙办理;一般事件则履行《一般事件办理流程》(见图5)。
问题响应整体流程
户
用服务呼叫
终
最
员
理
管系统事件
统
系
服务央求
人
重要系统故障?
否
紧急事件?
否
理
受
是
持
是
一般事件
支
升级流程
办理流程
重要故障
办理流程
服务
管理报告
(图1问题响应管理整体流程)
服务央求管理
支持受理人接受来自各种渠道提交的有关信息系统运维的服务央求、告警、故障事件等;
确认事件央求人可否属于服务对象。若是不是,则拒绝服务转交其他部门办理;问题大纲需要在《服务央求记录表》(见附录1)中进行详细的记录,如详细情况描述;
依照预定义的“系统服务分类”对事件涉及的系统进行分类,如:网络系统,主机系统、营销系统等;
依照预定义的配置管理数据库的有关内容,将事件与配置项联系起来;
选择事件的影响程度:
低:造成个别用户不能够正常接见。
中:局域网内高出5%的用户不能够正常接见。
高:营销系统、“95598”系统等核心业务系统大面积瘫痪,不能够正常对公众供应服务,造成负面的社会影响。
选择优先级:
无优先级:无时限要求,在方便的时候除去故障。低:24小时内除去故障。
中:8小时内除去故障。
高:4小时内除去故障。
最高:2小时内除去故障。
服务央求管理流程如图4所示。
服务央求管理
户
用
终
最
人
理
受
持
支
服务呼叫
记录服务央求事件
选择配置项目判断优先级
大纲及现象描述
服务呼叫种类及系
重要系统
紧急事件?
否
否
统服务分类
选择影响程度
故障?
是
是
A
C
B
重要故障
升级流程
一般事件
办理流程
办理流程
(图2服务央求流程)
重要故障管理
支持受理人达成服务央求流程后,若是事件是属于影响程度最高的故障,则立刻启动《重要故障办理流程》;
向最后用户发出服务中断通知;
支持受理人同时要赶忙将故障情况向运维负责人报告;
运维负责人应立刻通知有关领导以及灾害恢复领导小组(由主要业务部门领
导,信息中心领导,主管领导等组成),决定本故障可否经过上级运维部门才
能解决,若是是,则由问题反响者联系上级运维中心,上级运维部门依据有关流程予以解决;
若是不用上级运维部门解决,则依照恢复时间标正确定可否启动应急方案;确
定需要启动应急方案后,由应急方案小组履行恢复计划,使系统赶忙恢复运作;
同时运维负责人要召集所有有关技术专家(项目组技术负责人,服务商,厂商以及各系统管理员)进行集中诊断,拟定系统修复方案。并由有关系统管理人联合服务商一起履行系统修复方案;
系统修复并经测试成功后,支持受理人宣布系统服务恢复通知;
联合系统管理员在服务央求系统中将故障的所有信息进行更新,如解决方案,
关闭代码,若是在呼叫登记阶段录入的配置项目,分类等有误,需要一并修正;
联合有关系统管理员准备“重要故障责任报告”并提出整改措施;
运维负责人负责批阅赞成重要事件责任报告,并向有关领导发散此报告;
。重要故障管理流程如图5所示。