文档介绍::..文档简介木文档根据艾特项目服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力更为主动可控。二、文档目的标准服务器故障处理方法指引,硬件及系统软故障分别处理方法。具体操作说明1):服务器硬件的主动检查方式主要分三种:设备面板指示灯检查硬件系统日志检查第三方工具检查(-)面板指示灯检查IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,。图示说明详 细 描 述:序号描述状态说明1快速诊断板电源、风扇、内存、CPU、pci-=激活闪烁二系统被远稈•访问不臺二无人远程访问机器或没仃按UID按钮3内部健丿隶灯绿色=,的备件。参考快俩板红色=系统严直故障。确认仃呵心攵障的备件。参考吹速诊断板4 外部他廉灯绿色二正常{电源) 橙色二兀余电源故障。确认处于降级状态的电源。参照快速诊断板红色二严R电源战障。确认17严重故障的»t源。参考吹速诊断板5网卡*1指少灯绿色=网卡已连接闪烁二树k己连接且有数据访问不虫二网卡没有连麹如果电源关闭了,察看机器后边的RJ45灯察看状态6网卡2指示灯绿色二网卡已连接闪烁二网U已连接且有数据访问不亮二対卡没有连接。如果电源关闭了,察看机器后边的RJ・45灯察看状态7电源按钮/指示灯绿色二系统开机运行橙色二系统关机但电源正常连接F亮二电源线没有连接或电源故障8VGA接119两个USB接n编号描述状态1OnlineSparememory扌〔示,丿:J,绿=保护模式开启琥珀色闪烁=内存配置错误琥珀色=内存失败不亮=没自保护2 Mirroredmemory扌呂绿=保护模式丿「•启示灯 琥珀色闪烁=内存配置错误琥珀色=内行失败不亮=没右保护所右氏他拒示灯琥珀色=失败不亮=正常(二)第三方检测工具检查IBM诊断工具:IBMSystemsDirector、IBMSystemsDirectorActiveEnergyManager、:判断并确定最快恢复时间判断是否有做冗余设置判断是否需要关机操作磁盘设备检测并确定阵列信息,确定有做数据备份是否对其它关联应用有影响制定回退方案,保证数据与应用的可用性设备变更操作设备兼容性测试应用系统运行测试设备变更后正式应用2)服务器系统管理Linux系统管理1・(uptime)(df・h)(ps-ef|grepjava)查看应用程序启动进程数是否正常******@localhostroot3ZZ6root3ZZ7root3ZZ8root3233root3234root3333uth,^var/gdm/:0root45Z6root4577root4578Jttps1133Z8・Xauth3225452645Z6f6e1■011grez4ttz4ttz4tt24tt24ttZ4ttstenc11ttU11AttU116tty1?tV99961616161