1 / 9
文档名称:

系统应急预案.docx

格式:docx   大小:26KB   页数:9页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

系统应急预案.docx

上传人:我是开始 2020/9/5 文件大小:26 KB

下载得到文件列表

系统应急预案.docx

文档介绍

文档介绍:系统应急预案系统应急预案系统名称涉及部门财务部涉及人员及联系方式及职责人员名称人员所在单位人员联系方式预案事件描述:调整失败,可能涉及如下情况:1) 系统崩溃:系统出现重大故障是指所有的客户端程序都不能正常连接到服务器,任何合法的系统用户都无法正确登录系统,甚至于系统完全崩溃;2) 数据丢失: 系统数据丢失状态,如数据库服务出现故障,用户数据丢失,公司现有技术手段无法恢复;3) 服务停顿: 系统服务停顿状态,如系统由于不明原因导致大规模用户无法使用,服务停顿。4) 接口无法正常调用:系统无法正常调用财务管控接口(财务管控接口、 ERPRFC接口、ESB。预案处理要求1) 系统崩溃:停止系统后台服务,防止不知情用户继续投递数据。抓取并保存系统出错信息及日志文件,简单判断异常部位,通知相关人员到岗,保留现场,分析查找原因。2) 数据丢失:停止服务和后台数据库服务,将剩余用户数据进行备份,抓取并保存系统出错信息及日志文件,通知相关人员到岗,保留现场,分析查找原因。3) 服务停顿:联系网络管理人员、通知相关人员到岗,从网络和系统两个方面分析查找服务停顿原因。4) 接口无法正常调用:联系相关接口服务提供方,确认服务是否正常。注:对故障进行快速处理及归档,争取每次故障修复时间控制在两小时以内。演练要求对在线系统不造成影响在主要系统管理员人员变更和服务器、操作系统、主页发布软件发生变更时要进行演练。演练前应填写工作单,并对系统做全备份。演练结束形成演练总结报告。预案流程说明一、事件报警与确认:系统人员在对系统进行调整的过程中发现公司系统运行中的异常及其它故障。由运维人员首先确认系统是否发生重大故障,及时通知相应管控经理及信通公司相应负责人,启用预案。二、系统发生重大故障时,保护故障现场 :必须及时米取以卜措施,通知系统运维人员及时到场保证服务器不再有任何人进行任何操作通知所有使用系统的人员暂停对系统的登录三、 分析故障原因:操作系统级应急预案操作系统异常问题原因:由于操作系统自身服务崩溃或系统组件冲突,服务器操作系统无法正常运行,部署在此操作系统上的应用服务器受此影响无法正常启动及运行,服务崩溃。应急预案:联系操作系统服务商进行系统恢复,解决系统组件冲突。操作步骤:按照当地科信部门或系统运维部分相关操作步骤进行。磁盘空间不足问题原因:由于SAPCE服务器及对应的Oracle服务器自动归档备份功能开启,会造成备份文件逐步增加,文件累计达到一定数据大小后,导致系统磁盘空间不足,引发服务器各项服务组件无法正常运行,服务崩溃。应急预案:(1)删除SAPCE自动备份文件。进入SAPCE服务器自动备份文件保存目录,保留最近的2个备份版本,删除其余备份文件。删除Oracle归档日志。进入Oracle归档日志目录,保留最近1个月的归档日志备份,删除其余备份。如经过以上方式3仍无法释放磁盘空间资源,则需要进行服务器存储空间扩容。具体方案依据当地服务器硬件升级操作方案处理。操作步骤:(1)登录服务器,检查各分区磁盘剩余量。若剩余量低于 10%,需要进行备份及归档文件清理操作。进入SAPCE服务器文件备份目录,检查备份文件状态,若备份文件过多,可考虑删除最近2个备份版本之前的其余备份文件。进入Oracle归档日志存储目录,检查归档日志状态,若归档日志过多,可考虑删除1个月之前的归档日志