文档介绍:运维小组应急预案
随着网络信息化建设的不断深入, 加强机房各类设备、 系统以及信息与网络
安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。 为确保
系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”
的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、
反应迅速处置有力的机房安全体系的目标, 将正在发生或已发生事故的损害程度
减轻到最低,确保员工安全,特制定本应急处置预案。
本预案共分为应用系统故障应急流程和机房突发事件应急流程
系统故障应急流程
一、系统故障应急流程说明
1、故障发生
系统运维服务小组可从以下途径得知故障的发生:
、运维服务中心通过网管告警发现故障
、维护站点通过维护巡检发现故障
、用户发现故障,报给呼叫中心
、驻场工程师发现故障
2、报障受理
监控系统运维服务小组得知系统故障发生后, 立即响应, 并向报障人或单位
详细了解系统故障情况。
3、信息研判
运维服务小组根据了解到的系统故障情况进行分析判断, 以确定采用一般故
障处理流程还是立即启动系统突发故障应急处理预案。
4、预案启动
如需启动应急预案, 则立刻通知系统突发故障应急领导小组, 由领导小组启
动应急预案,对系统突发故障应急事件进行全面管控处理。
5、资源确认
系统突发故障应急预案启动后, 首先是根据现场突发故障实际状况、 紧急程
度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调 度和确认,主要有以下资源:
我公司技术支持人员;
相关厂家技术支持人员;
我公司聘请的技术专家
6、预案执行
按照既定的预案进行突发故障抢修, 如遇到问题及时向系统突发故障应急领
导小组汇报。
7、预案终止
预案的终止时间由故障现场技术人员根据现场的实际进展情况, 在与用户单
位有关部门协调后报系统突发故障应急领导小组决定。
8、结果上报
预案中止后, 相关预案参与人员将整个事件过程中的经验和教训, 修改、 完
善事件应急预案。然后集中上报至系统突发故障应急领导小组。
系统故障应急处理流程图
巡检人员发现 故障
驻场工程韩发 现故障
运堆服金中心 值折发现故障
呼叫中心接首
家术持
专技支
家术持
厂技支
司术持
我技支
资源民急
稿度流程
应急故瞳 推修处理
精率
机房突发事件应急流程
一、机房突发事件分类
1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。
2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络 与信息系统的损坏。
3、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐 怖袭击等引起的网络与信息系统的损坏。
二、应急处理人员组织机构
纽轨机构框架图
三、应急机构人员岗位职责
1、应急总指挥职责
保证在任何时间,及时协调应急行动所有涉及的岗位人员;
提供必须的紧急响应设备;
在紧急情况下全面负责紧急行动;
在必要时向外界求救,例如:119、110、120等。
2、应急副总指挥职责
在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;
根据获得的应急信息下达命令。
3、各相关设备负责人职责
负责尽快收集信息向应急总指挥汇报事故情况;
负责现场临时设备抢救和对事态的控制;
听从上级指挥人员的指挥。
四、突发事件处理原则
.预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息 安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管 理、技术、人员等方面采取多种措施充分发挥各方面的作用, 共同构筑安全保障
体系。
.快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的 信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
.分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责任制及联 动工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共 同履行应急处置工作的管理职责。
.以人为本。把保障人员以及公共利益的安全作为首要任务。
.常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案 演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科 学化、程序化与规范化。
五、机房应急开关机具体措施
机房各设备关闭顺序如下:
六、机房日常维护
1、建立健全机房管理制度
在正常工作日内,信息技术部人员负责对机房进行监控,主要职责是: 巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。
节假日期间技术人员轮流值班,负责处理有关异常情况。
机房采