文档介绍:服务器管理应急预案
服务器系统故障应急预案
1、服务器应用系统出现故障,系统恢复应急预案
(1)当服务器应用系统出现故障,安全管理员、系统管理员、应 用管理员应当立即初步确定故障的严重程度, 估计出现故障的应用系 统故障排除需要的时间,并根据应用系统需要保障的无故障运行时 间,采取不同的应用系统恢复策略。
(2)如果应用系统不能停机,立即启用热备份系统进行工作。
如果应用系统不能停机,而故障又可以在 10分钟之内排除,那 么安全管理员指导系统管理员和应用管理员立即排除故障,恢复系统 正常运行。
应用系统可以停机而故障又可以在2小时内排除,安全管理员, 应该断开服务器的网络连接,配合系统管理员和应用管理员,处理服 务器故障,尽快排除故障,恢复系统运行。
应用系统可以停机但故障排除不能在2小时之内完成,而应用系 统有冷备份系统,安全管理员,应该断开服务器的网络连接,通知系 统管理员和应用管理员启动冷备份系统,完成应用系统的安装、设置, 并进行数据的恢复,保证系统正常运行。
应用系统可以停机,而又没有冷备份的应用系统,那么安全管理 员应该通知系统管理员和应用管理员,备份现有系统的数据和程序, 如果不能进行备份系统的数据和程序,安全管理员应该从备份管理员 那里得到应用系统的最新备份。安全管理员在确定了应用系统有备份 的情况下,通知系统管理员重新修复或安装操作系统, 并配合应用管
理员重新安装或修复应用系统并恢复最新备份的数据。如果备份丢失 或不存在,安全管理员应该报告信息网络事件应急小组,并求助技术 支持商,完成对硬盘数据的恢复。
(3)备份管理员在应用系统出现故障时,应该及时查找本地的数
据备份,本地的数据备份损坏或丢失,应该立即从异地数据备份复制 应用系统的数据备份到本地。
(4)系统管理员和应用管理员应在确认安全的情况下,重新启动
故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数 据恢复;若重启失败,立即联系相关厂商和技术支持,请求援助,分 析故障原因,若经设备厂商或技术支持认定是硬件损坏,那么需要请 求厂商更具维修协议,进行保修或维修。在服务器硬件正常的情况下, 尽快做好系统软件的恢复或重新安装,之后再进行应用软件的恢复或 重新安装,再进行应用系统的数据恢复,应用系统完全恢复正常运行 后,重新启用恢复的应用系统服务器,再将备用系统停掉。
(1)发现不良信息或网络病毒时,系统管理员应立即断开网线,
终止不良信息或网络病毒传播,并报告信息网络事件应急小组。
(2)安全管理员应采取隔离网络等措施,协助系统管理员和应
用管理员及时杀毒、,并估计出故 障排除的时间,然后根据服务器应用系统的重要级别,采取不同的措 施。
(3)事态或后果严重的,信息网络事件应急小组应及时报告上
级主
领导。
(4)处置结束后,
响、处置结果在调查工作结束后一日内书面报告信息网络事件应 急小组主任。
(5)应急预案技术措施,如果出现网络病毒,系统管理员采用 瑞星杀毒软件或卡巴斯基杀毒软件和 360木马查杀工具,对整个计 算机进行杀毒。对不能确定是否为病毒的文件,应该询问安全管理员 和应用程序员来确定