1 / 4
文档名称:

磁盘阵列故障分析处理报告.docx

格式:docx   大小:10KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

磁盘阵列故障分析处理报告.docx

上传人:niupai11 2022/6/19 文件大小:10 KB

下载得到文件列表

磁盘阵列故障分析处理报告.docx

文档介绍

文档介绍:@@@@@@磁盘阵列
故障分析处理报告
报告提交人:@@@
现场工程师:@@@@@@
提交日期:2009年03月31日———————————————————— ——————一、故障描述
2009年3月22 日@@@@平安城市项目使@@@@@@磁盘阵列
故障分析处理报告
报告提交人:@@@
现场工程师:@@@@@@
提交日期:2009年03月31日———————————————————— ——————一、故障描述
2009年3月22 日@@@@平安城市项目使用的两台NAS存储服务器,其中有一台 设备出现物理磁盘丢失现象,我方与海康威视技术人员及相关人员到现场进行调试 了解,具体情况如下:
@@@@平安城市项目所使用的存储服务器的型号是:
DS-A1016R;采用RAID 5冗余磁盘阵列;磁盘存储阵列和存储管理服务器通过 ISCSI协议做IP SAN网络数据存储;其中有一台NAS存储服务器设备出现磁盘丢失 阵列报错现象。
二、处理过程
3月22 日晚上10点,出现磁盘阵列无法读写数据的情况。现场通过查找NAS 存储服务器事件日志记录发现第二块阵列控制卡的第3块和第8块物理磁盘有扇区 坏道报错记录,导致NAS存储服务器出现磁盘丢失阵列报错现象;出现两块物理磁盘 有坏道扇区情况下必须将有坏道的磁盘扇区
克隆到无坏道的磁盘扇区下,才能重新重构阵列恢复丢失的数据;

3 月 23 日将第 3 块硬盘克隆到新硬盘,整个克隆过程大概需要 6 个小时。克 隆完毕后,将克隆好的新硬盘装回磁盘阵列柜,重启磁盘阵列柜,磁盘阵列自动启动 阵列重构。阵列重构是根据 RAID5 的冗余校验信息,自动修正磁盘的错误数据。因 为磁盘阵列空间比较大,重构需要大概 2天半时间。但 3月 24 日凌晨 1 点半,重构 进度达9%的时候,访问第 2 张控制卡的第 7 块硬盘报错,重构中止。查看硬盘状态, 并没有显示第7 快硬盘有坏道。但查看日志时,发现访问第 7块硬盘时,多次出错。 因此初步判定第7 块硬盘校验数据出错,硬盘有损坏的征兆,但不明显。
3 月 24 日将第 7 块硬盘克隆到新硬盘。克隆完毕后,将克隆好的新硬盘装回 磁盘阵列柜,重启磁盘阵列,磁盘阵列自动启动重构。但 3 月 25日凌晨 2 点半,重构 进度达 17%
的时候,访问第 2 张控制卡的第 8 块硬盘报错,重构中止。第 8 块硬盘有多个 坏扇区,需对第 8 块硬盘进行克隆。
3 月 25 日将第 8 块硬盘克隆到新硬盘。克隆完毕后,将克隆好的新硬盘装回 磁盘阵列柜,重启磁盘阵列,磁盘阵列自动启动重构。此次重构比较顺利,到3 月27 日中午重构完毕。
因3 月26 日系统终验,而磁盘阵列在重构的过程中,能同时读写数据,因此,3 月 26 日凌晨 0 点开始把数据备份到另一台磁盘阵列。
3 月 27 日中午重构完成时,虽然阵列状态显示正常,数据能正常读写,系统依 然报“盘位丢失”错误。海康威视技术人员通过阵列系统命令行界面,修复了系统 错误。NAS存储服务器数据文件已得到恢复,并显示系统正常。考虑到数据的重要 性,我们把数据全部备份到另一台磁盘阵列,并在刚修复的磁盘阵列柜上重建阵列。
三、故障情况分析
RAID5多用于OLTP(联机事务处理系统)其基本特征