1 / 8
文档名称:

服务器故障排除方法.doc

格式:doc   大小:26KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

服务器故障排除方法.doc

上传人:相惜 2020/4/7 文件大小:26 KB

下载得到文件列表

服务器故障排除方法.doc

文档介绍

文档介绍:服务器故障排除方法本文主要是针对一些服务器出现的简单的故障进行排查处理,主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题,第二部分讲述了一些服务器硬件故障排除的实例,第三部分讲述了一些服务器软件故障排除的实例第一部分服务器故障排除的基本原则性问题服务器开机无显示应怎么办检查供电环境,零-火;零-地电压?检查电源指示灯,如果亮,正常吗?按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗?是否更换过显示器,更换另一台显示器。去掉增加内存。去掉增加的CPU去掉增加的第三方I/O卡检查内存和CPU插的是否牢靠ClearCMOS更换主要备件,如系统板,内存和CPU服务器故障排错的基本原则是什么尽量恢复系统缺省配置a:硬件配置:去除第三方厂商备件和非标配备件;b:资源配置:清除CMOS,恢复资源初始配置;c:BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序;d:TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗?从基本到复杂a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。交换对比a:在最大可能相同的条件下,交换操作简单效果明显的部件;b:交换NOS载体,既交换软件环境;c:交换硬件,既交换硬件环境;d:交换整机,既交换整体环境;服务器故障排除需要收集哪些信息?服务器信息:机器型号机器序列号(S/N:如:NC00075534)Bios版本是否增加其它设备,如网卡,SCSI卡,内存,CPU硬盘如何配置,是否做阵列,阵列级别安装什么操作系统及版本(ware,Sco,others)故障信息在POST时,屏幕显示的异常信息服务器本身指示灯的状态?报警声和BEEPCODESNOS的事件记录文件?EventsLog文件确定故障类型和故障现象:开机无显示;上电自检阶段故障;安装阶段故障和现象;操作系统加载失败;系统运行阶段故障;第二部分服务器硬件故障处理几例硬件故障是指服务器硬件出现异常而导致的各类错误。由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。下面以一台万全4500为例说明。(例子,在实际问题中如果遇到相似现象,也需要具体问题具体分析,不要盲目套用);有一台万全4500,配有256M内存,使用一个PIIIXEON500带2M高速缓存的处理器。开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。因为CPU板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错误的,并且在系统日志中会提示致命错误,但报CPU电压错的情况也有5%左右。我们立刻把CPU调换在另一CPU插槽中,开机后依然是刚才的那种故障。所以在初步判断中,可以排除是CPU板块坏。这时,取出CPU仔细擦拭金手指,以及CPU板块中与CPU接触的地方后,开机依然无显示。相对处理器坏的情况来说处理器电