1 / 8
文档名称:

服务器故障应急响应方案说明.doc

格式:doc   大小:2,248KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

服务器故障应急响应方案说明.doc

上传人:艾米 2024/5/13 文件大小:2.20 MB

下载得到文件列表

服务器故障应急响应方案说明.doc

相关文档

文档介绍

文档介绍:该【服务器故障应急响应方案说明 】是由【艾米】上传分享,文档一共【8】页,该文档可以免费在线阅读,需要了解更多关于【服务器故障应急响应方案说明 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。-03-、,可以分成很多种导致服务器出现故障的原因,根据服务器故障出现的状况进行分类,确定故障属于哪一个级别,根据相应的故障级别对故障做对应的处理,确保故障的处理流程是标准化的。如果没有一套故障处理的标准,工程师只能靠经验去判断,但是依靠经验判断并不是不可以,有时候这种处理方式会很高效,但是大多数这种处理方式都是不太合理的,如果更换了运维工程师,显然每一个工程师通过经验去判断故障原因的方式都不尽相同,这样的差异将会使故障处理事后不能够得到很好的记录与存档,以供其他工程师以后借鉴故障处理案例。故障处理标准化的优点:根据流程可以确定哪些故障应该立即汇报上级,哪些可以自行解决后,再写故障处理报告汇报上级,这样做有助于提高故障处理效率。对于工程师经验判断,可能出现判断失误的情况,根据故障判断流程,可以不遗漏任何可能的情况对服务器故障进行排除。有时候工程师处理了故障之后只是简单的做了一下汇报,并没有一些故障处理过程的记录,以及故障处理的详细时间记录,这样对需要追溯以前的具体情况的时候就束手无策了。划分故障等级故障级别故障说明故障处理第一步Ⅰ级(紧急)当系统出现下列相当严重的现象时,属一级故障:系统整体瘫痪,全部操作失去响应;系统崩溃,关键硬件或文件系统损坏无法自动修复;发生间歇性、随机性、重复性的启动或应用退出,无法保障公司业务的正常处理。立即汇报上级Ⅱ级(重要)当系统出现下列比较严重的现象时,属二级故障:关键部件(含软、硬件)停止工作,导致系统降低运行状态,客户业务受到严重影响;系统整体性能严重下降,无法自动恢复正常运行状态;重要数据、参数和配置信息损坏,无恢复,导致客户数据及业务记录严重损失;Ⅲ级(关键)当系统出现下列现象时,属三级故障:部分设备或软件异常,局部功能受限,系统整体仍可正常工作,对客户业务影响不大或存在隐患;关键备用设施因故障离线,主用设施仍能正常工作;系统运行指标(例如:I/O效率、CPU效率)受到直接或间接影响,客户业务处理缓慢;立即汇报上级Ⅳ级(告警)当系统出现下列情况而不影响客户业务时,属四级故障:不在运行状态的线路、端口损坏;出于安全考虑并且是受保护的软件降级或应用重启;因存储空间不足导致的性能下降;系统硬件、软件产品功能、安装、或配置方面的支援;业务仍然可以正常运作,但是服务器报出故障信息的;故障排错判断故障分类序列问题种类详细内容一机房网络故障1、骨干网光纤切割;2、机房网络升级;3、机房网络设备调试;4、机房网络设备损坏;二政府部门封网1、服务器没有备案;2、域名备案存在问题;3、***导致服务器违法行为;4、违规***;5、服务器转发违禁网站;6、服务器放置的网站内容不符合当地的政府法例法规;三机房铺助设备故障1、机房空调故障问题;2、机房灰尘过多问题;3、机房电力供应问题;、机房遭遇火灾事故;2、机房遭遇地震事故;服务器出现故障故障应急处理流程判断故障级别汇报上级汇报上级汇报上级Ⅰ级(紧急)Ⅱ级(重要)Ⅲ级(关键)Ⅳ级(警告)记录发生时间记录发生时间记录发生时间故障排错流程故障排错流程记录发生时间故障排错流程故障排错流程问题处理完成故障处理报告发送邮件给相关人员服务器故障处理完毕故障排错流程故障排错开始是否有备用服务器判断故障等级是否属于Ⅰ级或Ⅱ,根据故障分类确定故障范围,逐条排除尝试修复故障,并且验证是否解决问题 否是故障处理完成数据与日志备份在进行故障修复的时候,需要对服务器系统以及软件的配置文件进行修改,这些修改可能造成的风险是很大的,这时保存备份配置文件信息、应用数据、系统日志信息会很重要,可以直接通过shell脚本对服务器重要的数据进行备份。故障处理报告故障处理报告文件命名规则文件名前缀故障级别服务器名称故障类型故障处理报告Ⅰ级—紧急Linux服务器名称(终端#前面的字符)故障分类—详细内容Ⅱ级—Ⅲ级—关键Ⅳ级—告警例如:故障处理报告_Ⅰ级—紧急_squid-chendu_系统崩溃故障处理报告内容故障发现时间Xxxx年xx月xx日xx:xx(24小时制)处理完成时间如果处理一次就解决的直接写:Xxxx年xx月xx日xx:xx(24小时制)如果多次处理后才解决,按下面格式写:Xxxx年xx月xx日xx:xx(24小时制)Xxxx年xx月xx日xx:xx(24小时制)Xxxx年xx月xx日xx:xx(24小时制)故障处理人员故障描述根据故障等级划分的说明加上一些详细的内容故障处理过程故障排错的详细过程,