文档介绍:算机机房环境设施应急演练方案
作者: 发布于:2013-5-8 14:25:29 点击量: 1830
 
计算机机房环境设施应急演练方案
本次机房环境演练分为:市电供应中断、机房空调故障等2种情况。要求各演练单位针对每个演练项目形成演练报告,对演练中发现的问题进行及时总结,及时修改完善应急预案。
一、演练内容一:机房市电供应中断实战演练
二、情景设计
大楼配电室通知市电中断或UPS设备输入电源出现故障,造成UPS市电供应中断。建议市电中断不要超过1个小时。
空调系统故障可作为市电中断引起系列故障中的一个特例,故不另行组织演练。机房UPS系统双机同时出现故障的情形已超出演练范围,不作为本次演练内容要求。
三、分工安排
各单位自主安排演练时间,要求各单位科技部门、业务系统管理部门、后勤保障部门相关人员参加。
四、前期准备
(一)       计算机机房供电系统线路图纸、配电系统维修工具、手持应急照明灯具、应用系统和电子设备正常关闭的操作流程和密封保存的操作密码。
(二)       掌握UPS系统电源有效供应时间,了解业务系统数据应急备份和设备正常关闭需要时间。
(三)       掌握空调系统因电力中断无法运转时计算机机房温度升高速度。
(四)       全面检查计算机机房供电系统状况,重点确保UPS主机系统和电池组等处于良好运行状态。
(五)       请求当地电力供应单位予以配合,保证演练期间电力供应稳定。
(六)       通知UPS供应商或维护商做好相应备件及技术支持准备,以防止UPS后备电池因维护保养不善造成其使用寿命缩短或UPS主机在进行逆变切换时发生故障。
(七)       演练前对网络系统及应用系统进行一次系统备份和数据备份。
五、风险和对策
存在因电池组质量问题致使UPS有效供电时间缩短,引起UPS供电突然中断,或者因市电不能及时供应造成UPS无法有效得到充电,造成机房网络设备和应用系统服务器宕机,引起内联网中断、通讯中断、各应用系统停止运行等重大安全事故。
为了应对演练带来的风险,必须做好各类系统的应急保障,备份网络设备配置和所有应用系统数据,以便尽快恢复。
同时请各单位和当地供电部门积极沟通,保障演练期间市电正常供应。
六、演练步骤
(一)       各单位领导小组发布正式演练命令。
(二)       故障发现。各单位大楼配电部门断开计算机机房的输入电源或执行小组(机房组)断开UPS的输入电源。之后,大楼配电部门通知科技部门市电中断,或执行小组通过计算机机房场地监控系统发现UPS系统市电供应中断。
(三)       执行小组(机房组)组织检查UPS主机运行情况和电池组放电状况,记录UPS系统放电速度。
(四)       执行小组(机房组)与大楼配电部门值班人员联系或大楼值班电工查找市电中断原因,确定故障点和市电预计恢复时间。
(五)       执行小组向领导小组报告市电中断原因、UPS系统运行情况和备用电池组放电预计时间、计算机机房温度提升速度。
(六)       执行小组通知业务组做好进行数据备份、业务系统和电子设备关闭的操作准备工作。
(七)       领导小组根据UPS系统实际供电能力和时间、计算机机房温度提升速度,命令业务组部分关闭或全