文档介绍:该【机房应急预案合集15篇 】是由【1772186****】上传分享,文档一共【36】页,该文档可以免费在线阅读,需要了解更多关于【机房应急预案合集15篇 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。机房应急预案
机房应急预案合集15篇
在现实的学习、工作、生活中,有时会出现一些意料之外的事件 或事故,为了减小事故造成的危害,通常会被要求事先编制应急预案。 那么优秀的应急预案是什么样的呢?以下是店铺精心整理的机房应急 预案,欢迎大家分享。
机房应急预案1
机房是我单位的重要场所,重要仪器、设备相对集中,一旦发生 事故,会造成严重后果。为此特制定本应急预案。
一、触电
(1 ) 一旦发生触电事故,应迅速安全切断电源,切忌直接接触 触电者。
(2 )即刻拨打紧急电话120并通知相关领导,同时开展现场应 急救护。
二、火灾
L报警程序:
即刻通知领导及相关部门,根据火情大小如需报警立即就近用电 话或手机报告消防中心(电话119 ).o
2、组织实施:
机房管理员一旦发现火情后,应即刻切断电源,并使用灭火器扑 救起火设备。
三、空调漏水
若空调系统出现渗漏水,应立即安排停用故障空调,清除机房积 水,并及时联系设备供应方处理,同时临时用电扇进行降温。
四、设备发生被盗或人为损害事件
(1 )发生设备被盗或人为损害设备情况时,使用者或管理者应 立即报告中心负责人,同时保护好现场。
(2)中心负责人接报后,通知保卫处,一同核实审定现场情况, 清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
1、对机房里的温度进行调节,如室内温度过高,调节空调对机房 进行有效的通风。
2、查看交换机与防火墙及接入设备的工作状态,如发生异常,对 其进行及时有效的维护。
3、监测网络运行状况。
第九条除本酒店网络管理员外,公司其他人员因工作需要进入机 房的,需网络管理员陪同下进入机房。
第十条严禁带外单位人员或无关人员进入机房,确因工作需要, 如:系统故障诊断和处理,设备维修维护、系统或设备安装等进入机 房,必须由网络管理员陪同进入,。
第十一条进入机房的设备应在进入机房前拆除外包装,以保证机 房环境的清洁和安
第十二条严禁携带易燃、易爆、易腐蚀等危险性物品进入机房。
第十三条机房内提供的UPS电源只允许为主机、服务器、网络及 存储等核心设备供电,严禁安插其他设备,增加UPS电源供电负荷。
第十四条严禁擅自切断供电系统,确因工作需要断电时,首先应 做好相应准备工作,经部门领导批准,然后给所有部门发放断电或断 网通知,最后方可实施。
第十五条机房内安装用电设备或有用电需求的项目时,必须经过 专业人员或设备提供商的安装工程师进行现场勘查,经确认在满足或 符合要求后工程才能实施。
机房应急预案5
第一条:机房意外停电后,首先确定停电的范围以及受影响的设 备范围。
第二条:确认停电的范围为本公司或本机房,应立即联系工机科 电话汇报。估算电力可能恢复的时间,并通知直接上级。
第三条:如果确认停电的时间在1个小时内,可以在UPS正常供 电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电, 需及时到达现场。做好各设备的电源停电准备。 小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核 心交换机和路由期。等待电力恢复,电力恢复供电后转第七条执行。 如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维 护负责人。
第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态 处于下电状态。并向直接领导汇报,马上联系相关厂家,如有可能请 厂家立即到现场支持。第五条:将掉电的所有的设备电源状态处于下 电状态,。
第六条:等各厂家和相关的人员到齐后,商议设备恢复时因注意 的事项,并形成相关文档。
第七条:电力室恢复供电后,先不要急于给电源柜加电,等待 10—20分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。
第八条:供电正常后,确定设备处于下电状态后,打开电力柜的 总控开。第九条:根据设备加电顺序,启动分项空开。第十条:设备 加电顺序,网络交换类设备正常后再给磁盘阵列柜加电,存储状态检 查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。 第十一条:设备启动正常后,开始启动数据库。第十二条:数据库启 动正常后,开始启动中间件服务器。第十三条:中间件服务器正常后, 启动应用程序。
第十四条:机房设备进行全面点检,确认所有设备运行和服务正 常。
机房应急预案6
机房消防应急预案
为使信息机房发生火灾事故时,当班人员能镇静有序地处置事件, 特制订本预案,请各成员认真学习,熟悉应急处置程序,提高全员的 应急能力,一旦发生突发事件,尽最大努力保证员工人身安全和减少 损失。
起火原因一般有明火管理不慎;电气设备管理、使用不当;纵火 等原因。
预案一:当闻到烧焦气味时
当班人员发现信息机房内有冒烟现象或闻到烧焦气味时,可能是 某处阴燃处于起火阶段或电源超负荷发热引起,容易引发火灾,当班 人员要立即查明原因和地点,针对不同情况,采取迅速将火源扑灭或 关闭电源总开关、隔离火源附近易燃物、关闭窗等措施,消除起火隐 患,防止引了火灾。事后立即向安保部门报告,并做好现场保护工作 和防止起火点复燃,不得随意离开现场和将事故隐瞒不报。预案二: 当班时发现起火或冒出浓烟
由于起火源隐蔽或其他突发原因未能及时发现和消除起火隐患, 酿成明火和冒出浓烟,燃烧面积不大,就是火灾的初起阶段,当班人 员发现起火或冒出浓烟时,切忌惊惶失措,要沉着、果断,会同其他 当班人员分工协作,迅速查明原因组织扑救,当火执已无法控制时处 置办法:
一是指定专人立即拔打"119"火警电话报警和向上级保卫部门报 告,并向本部门和周围的'人及群众喊叫报警;二是组织本单位、部门 在场的人员有序地投入扑救工作,充分利用消防栓、灭火器、水桶等 器材灭火,不能消极等待消防队到来,而错过灭火良机,力求将火扑 灭或控制火势蔓延,不能只顾个人安危而逃离火场
三是大声呼喊请求邻近单位及群众的支援。
四是在组织灭火同时,要立即组织人员疏散和转移物品中,特别 昌易燃、易爆物品和易受到火舌威胁的现金、重要凭证要及时转移到 安全地点,并派人员守护,确保安全。
五是灭火后要注意保护现场,维护好秩序,以利于消防部门调查 分析火灾原因。注意事项:
报警人员报警时要向消防部门讲清楚起火地点、单位、起火的种 类和火势大小,报警后即到街道或十字路口迎接、引导消防车辆的到 来;扑救人员在消防人员到来后,要立即向消防指挥人员讲清火场内 存放有何种物资和贵重物品,火场内是否有爆炸、剧毒物品,并协助 消防部门维护好现场秩序。自行扑救火灾时要留心观察火势和环境, 防止被火围困、烟气中毒、坠物砸伤等,在确保自身安全的情况下扑 救火灾。
机房应急预案7
中心机房突发事件应急预案 第一条
机房突发事件包括网络设备或服务器故障、自然灾害(水、火、 电等)造成的物理破坏、人为失误造成的安全事件等等。针对突发事 件的预防措施如下:
.建立安全、可靠、稳定运行的'机房环境,防火、防盗、防雷电、 防水、防静电、防尘;建立备份电源系统;加强所有人员防火、防盗 等基本技能培训I。
.服务器采用可靠、稳定的硬件设备,落实数据备份机制,安装
有效的防病毒软件,及时更新升级扫描引擎;加强对局域网内所有用 户和信息系统管理员的安全技术培训。
第二条 机房漏水应急预案如下:
.发生机房漏水时,第一目击者应立即通知机房管理人员。
.若空调系统出现渗漏水,机房管理人员应立即安排停用故障空 调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调, 必要情况下可临时用电扇对服务器进行降温。 水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知 办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第三条 机房火灾应急预案如下:
L完善机房环境,确保机房具备二氧化碳灭火器;禁止携带易燃 易爆物品进入机房。 规则,了解消防设备操作原理,掌握消防应急处理步骤、措施和要领, 懂得灭火的方法,会扑救初起火灾,并定期组织灭火演习。 生火灾,迅速切断机房电源,避免灾情的扩散,并迅速拨打物业管理 和119火警电话。
.等待消防车到来期间,应组织物业保安或工作人员在保证安全 的前提下灭火,应急领导小组应在第一时间内集中所有二氧化碳灭火 器,抓住时机,尽可能的把火扑灭。
.配合消防部门调查事故原因,对造成的损失和起火原因做好记 录,以便进行灾后总结。
第四条
雷击事故应急预条如下:
.遇雷暴天气,机房管理人员在下班后应及时关闭所有服务器, 切断电源,暂停内部计算机网络工作。
.雷暴天气结束后,机房管理人员应及时开通服务器,恢复内部 计算机网络工作,对设备和数据进行检查。出现故障的,事发部门应 将故障情况及时报告机房管理人员。
.因雷击造成损失的,机房管理人员应会同相关部门进行核实、 报损,并在调查工作结束后一日内书面报告领导。
第五条
设备防盗被盗或人为损害应急预案如下:
.机房管理人员每日查看、清点设备并锁好机房大门。
.机房管理人员每日检查录像监控服务器状态,确保监控画面正 常,并检查每日录像正常性、完整性。
.发生设备被盗或人为损害设备情况时,使用者或管理者应立即 报告相关负责人,同时保护好现场。
.机房维护人员接报后,通知保安及公安部门,一同核实审定现 场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和 文字记录。
.事发单位和当事人应积极配合公安部门进行调查,并将有关情 况向机房管理人员汇报。
第六条
机房停电应急预案如下:
.接到停电通知后,机房管理人员应及时通过办公系统、电话等 发布相关信息,部署应对具体措施,要求用户在停电前停止业务、保 存数据。
.机房管理人员每日检查UPS电源的状态,确保在突发停电时, UPS电源能自动供应服务器正常工作半个小时,保证员工工作的数据 及时保存。
第七条
通信网络故障应急预案如下:
.发生通信线路中断、流量异常等故障后,员工应及时通知机房 管理人员。
.机房管理人员在接到报告后,迅速组织相关技术人员检测故障 区域,并作相关故障处理,必要时通知通信网络运营商查清原因;逐 步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
.应急处理结束后,机房管理人员应在一日之内提交故障分析报 告,以便备案。
第八条
服务器故障应急预案如下:
L机房管理人员每日检查服务器状态,检查邮箱服务器状态,确 保系统运行的完善。
.机房管理人员定期备份服务器数据,并将备份资料刻录成光盘 或拷贝到移动硬盘。
第九条
,机房管理人员应采取有效措施开展先期
处置,恢复信息网络正常状态。应急处置工作结束后,机房管理人员 对事件发生原因、性质、影响、后果、责任及应急处置能力、恢复重 建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和 技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改 存在隐患,组织恢复正常工作秩序。
机房应急预案8
.主机和运维管理制度简介
超级计算机是功能最强、运算速度最快、存储容量最大的一类计 算机。目前只有少数国家掌握研发技术,系统造价非常昂贵,多用于 国家高科技领域和尖端技术研究,是和综合国力的 重要标志。上海超级计算中心作为上海信息港主体工程之一,国家和 上海市政府投资先后引进神威-I超级计算机、神威-64P集群计算机、 曙光4000A超级计算机系统并投入商业化运行。
上海超级计算中心自20xx年正式开通至今,
这些高性能计算机系统已安全、稳定运行七年多时间,上机用户 取得了丰硕的科研成果和社会效益。在这七年中,为保障这些高性能 计算机系统安全、稳定、不间断地运行,技术支持部在中心引进第一 台高性能计算机-神威-I超级计算机系统的同时,建立了机房应急预案、 运行记录、设备运行参数等基础运维制度,在二期引进曙光4000A超 级计算机系统过程中,不断完善原有运维制度,并针对该主机系统特 点编写了大量操作方法和应急预案。
中心自20xx年获得IS027001 ( BS7799 )信息安全认证以来, 技术支持部根据其要求规范了文档体系建设,形成了机房管理制度、 应急预案、操作方法、运行情况记录的四大类运维文档。
正是这些运维管理制度的不断完善和有效执行,才确保了资产价 值高、服务对象广、社会影响大的中心主机系统安全、稳定运行,保 障重点项目、用户服务的连续性。
.应急预案重要性
上海超级计算中心机房运维管理文档划分为机房管理制度、应急 预案、操作方法、运行记录共四大类。
应急预案在应急系统中起着关键作用,它明确了在突发紧急情况 发生之前、发生过程中以及刚刚结束之后,谁负责做什么、何时做, 以及相应的策略和资源准备等。它是针对可能发生的重大事故,按照 其影响和后果严重程度,在应急准备、响应、操作各个方面预先做出 的详细安排,是开展及时、有序和有效事故应急工作的行动指南。因 此,应急预案在这四类运维管理文档中处于最为重要的地位。
.应急预案分类
应急预案按重要性和事件种类,可以划分为消
防预案、断电预案、空调预案、其他预案共4种,预案各文档之 间彼此独立又互为关联,具有非常强的可操作性。制定预案的指导原 则是尽一切可能,最大限度地确保向用户提供的服务不中断。在紧急 事件发生的情况下,保证核心设备连续运行,避免存储数据丢失。在
事件处置完成后
能快速恢复高性能计算服务。
消防预案
消防预案是主机房最重要的应急预案。该类预案根据《上海超级
计算中心灭火和应急疏散预案》的原则并结合主机房主机设备和消防 设备的运行特性而制定。主要由《主机房消防应急预案》和《主机房 气体喷淋消防系统启动撤离及处置应急预案》2个文档组成。
消防应急预案:该预案着重规范了火警事件发生后,所有主机维
护人员如何根据所属区域和现场情况,判断和选择正确的处理方法, 同时配合中心物业人员处置,降低事件带来的影响。
对于设备发生烟雾,主机维护人员协同物业人员寻找烟雾点予以
切断相关区域电源;当设备发生可以控制火情,协同物业人员灭火; 当主机房发生火灾而无法控制,应采取施救方法等措施。
气体喷淋预案:该预案描述主机房气体喷淋系统启 动的响应和确认并具体规定了撤离机房路线、善后处置。
这两个预案中,消防应急预案作为消防预案
的主体,涉及到如何处理与消防有关情况的各个方面。气体喷淋 预案是主机房发生重大火灾时应对的最终灭火手段和人员撤离引导方 法。
断电预案
断电预案的重要性仅次于消防预案。该类预
案根据中心供配电系统实际情况和各种断电影响范围下对主机运 行的最小保障要求而制定的。主要由
《主机房断电应急预案》、《曙光4000A超级计算机系统紧急关 机操作方法》、《曙光4000A超级计算机系统双路断电关机操作方法》 等多个文档组成。
主机房断电应急预案:该预案用于断电情况
下,主机维护人员如何与中心物业部门联系控制主机房供电情况, 并且负责对主机系统运行受断电影响程度做出正确判断。指导维护人 员按影响程度,分别选用预案中对应的操作方法。本预案在所有断电 预案中起指导思想作用。紧急关机操作方法:该预案制定了主机系统
在紧急情况下,最快速度关机的操作步骤。主要用于发生烟雾、明火 或消防、断电预案需在数分钟内关机断电的事件。
双路断电关机操作方法:该紧急操作预案主要用于在外界双路供 电全部中断情况下的操作。
该预案的关机原则是:根据实际电力供应考虑操作步骤,宁慢勿 快,在时间允许的情况下,最大程度保证存储节点、SAN和SCSI存储 设备、工程用户的计算节点的运行,尽可能减少关闭范围,以确保能 在恢复供电的情况下,主机尽快恢复正常运行状态,减少影响范围。
空调预案
超级计算机系统在运行中消耗大量电能,在
提供高性能的计算能力同时产生大量的热量,必须采用专用空调 系统,以保持主机系统适当的温、湿度、空气洁净度等运行环境需求。 因此,专用空调系统与主机系统密切相关,空调预案是主机房必备的 应急预案。
制定该预案的原因在于,断电情况下,空调与主机系统存在互相 牵制的现状。主机和空调系统均为外界双路供电,主机系统配有UPS 不间断电源系统,而空调系统无UPS支持。在双路停电情况下,主机 系统可获得UPS电池组支持运行若干分钟,空调系统无UPS支持只能 停机。由于在无空调冷却情况下,主机系统会在短时间内积聚大量热 量导致超过运行警戒温度,主机系统在有可供电余量的情况下,仍将 被迫关机。因此,确保空调中断情况下的主机运行环境是该预案的制 定原则。
预案根据各台主机配备的空调系统特点制定,由《曙光机房空调 系统故障应急预案》和《神威机房空调系统应急预案》2个文档组成, 这里仅介绍曙光机房空调系统应急预案。
该预案的第一步:考虑增强主机系统散热效
果,采用打开主机机柜前后门,和机房周边木门,在通风道上布
置有UPS支持的应急风扇,形成空气对流,
带走热空气,从而增强主
机系统散热效果,降低升温速度。
该预案的第二步:在采F
上述措施并持续升温到一定温度之上的