文档介绍:国防科学技术大学
硕士学位论文
基于智能预警和自修复的高可靠磁盘阵列关键技术研究
姓名:胡维
申请学位级别:硕士
专业:计算机科学与技术
指导教师:刘光明
2010-11
国防科学技术大学研究生院硕士学位论文
摘要
随着高性能计算和数据中心存储规模的飞速增长,以磁盘为基础的存储系统
可靠性已成为影响整个计算机系统可靠性和可用性的关键因素之一。而现有提高
存储可靠性的方法,还存在对故障磁盘的容错能力不高、系统修复过程中对用户
服务质量降低、修复成本高等缺陷,难以充分满足实际应用的需要。
本文以磁盘阵列存储系统可靠性作为研究内容,提出基于智能预警和自修复
的高可靠磁盘阵列存储系统,大幅降低了数据丢失的风险,提高了磁盘阵列存储
系统的可靠性和可用性。
本文的研究工作主要包括以下几个方面:
(1)研究提高存储可靠性的主要方法。在对磁盘运行原理进行深入分析的基
础上,对磁盘阵列存储系统可靠性的相关内容和相关技术进行了详细的分析,确
定了以故障预测为主的提高磁盘阵列存储系统可靠性的技术方案。
(2)采集磁盘阵列运行环境下各个磁盘的 信息,采用样本均值、
趋势分析和信息增益三种属性评估方法,得到了与磁盘运行状态发展趋势密切相
关的属性集。
(3)研究了机器学习领域分类算法的原理和应用,分析和实现了朴素贝叶斯
分类器和支持向量机分类器,提出用决策树算法和提升算法相结合的策略构建分
类器(DTB 分类器),应用于磁盘故障预测,经过性能评测,在误报率可接受的
情况下,故障预测性能明显提高。
(4)提出基于数据迁移的数据自修复保护机制。应用自适应反馈理论,对于
已经预警将要发生故障的磁盘,采用 SFM-DMA 迁移算法,自动进行数据保护。
实验结果表明,数据自修复过程不仅能够迅速保护数据,且整个过程对用户透明,
在提高系统可靠性的同时做到了较小的性能损失。
(5)实现了基于智能预警和自修复的高可靠磁盘阵列原型系统 IFPS,用软件
模拟了整个系统的运行过程,对系统的可行性和性能进行了评估。结果表明,IFPS
系统相比普通磁盘阵列,其可靠性和可用性有明显提高。
本文的研究工作对提高磁盘存储可靠性提供了新的技术方法,其中一些设计
思想和关键技术,对其他设备可靠性的提高同样具有参考价值。
关键词:存储可靠性,,决策树分类,数据迁移
第 i 页
国防科学技术大学研究生院硕士学位论文
ABSTRACT
With the rapid growth of the storage capacity of the data center, the reliability of
the disk-based storage system is ing one of the most important factors that
influencing the reliability and availability of the puter system. However, the
existing methods of improving the storage system reliability have some defects, such as
fault redundancy is low, availability reduction when repairing the system, and the cost is
high, so it can’t meet the needs of practical applications.
This paper takes the reliability of disk-based storage as of topic, and proposed an
disk array storage system based on intelligent failure prediction and self-healing, which
can reduce the risk of data lost and greatly improve disk array storage system’s
reliability and availability.
What we have done are as follows:
(1)We study the main ways to improve the reliability of storage. Based on deeply
analyz