文档介绍:代号 10701 学号 1020121214
分类号 密级公开
题(中、英文)目基于 DHT 的存储系统中纠删码技术研究
Research on Erasure Code in Storage System
Based on DHT
作者姓名彭荣华指导教师姓名、职务权义宁副教授
学科门类工学学科、专业计算机系统结构
提交论文日期二○一三年一月
创新性声明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究
成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不
包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或
其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做
的任何贡献均已在论文中做了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。
本人签名: 日期
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究
生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕
业离校后,发表论文和使用论文工作成果时署名单位仍然为西安电子科技大学。
学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全
部或部分内容,可以允许采用影印、缩印或其它复印手段保存论文。(保密的论文
在解密后遵循此规定)
本人签名: 日期
导师签名: 日期
摘要
基于分布式哈希表(DHT)的云存储系统有着良好的扩展性和快速的数据存取
能力。基于 DHT 的数据存储系统具有动态性和异构性,导致数据随时可能丢失。
因此,如何保证 DHT 系统的高可用性成为研究 DHT 存储系统的关键问题。
本文研究了基于 DHT 的云存储系统的冗余机制和基于柯西矩阵的纠删码技
术,并改进了柯西编码的编码运算和数据更新策略。本文的主要工作概括如下:
1. 概述了分布式哈希表的设计原理和几种常见 DHT 协议的基本原理,分析
了传统的副本和纠删码两种数据冗余机制,阐述了运用在 DHT 存储系统中的 RS
纠删码的原理。
2. 分析了基于柯西矩阵的 RS 纠删码的原理,根据柯西编码过程中有限域运
算的特点给出了一种减少运算过程中异或操作个数的算法。实验结果表明通过该
方法有效地减少了运算过程中异或操作的个数,从而相对传统 RS 码而言有着更优
的编码性能。
3. 仔细分析了现有的两种数据更新策略,并给出了一种新的数据更新策略。
通过将数据更新过程中的运算分布到多个节点来减少更新过程中运算时间,有效
地提高了数据更新的效率。仿真结果表明本文所给出的数据更新策略比传统的更
新策略有着更高的效率。
关键词:分布式哈希表(DHT) 纠删码柯西码可用性数据更新
Abstract
Cloud storage system based on distributed hash table (DHT) has good scalability
and fast data access ability. Data storage system based on DHT has the dynamic and
isomerism, which may cause data loss at any time. Therefore, how to guarantee the high
availability of DHT system e the key problems of DHT storage system.
In this paper, redundancy mechanism in cloud storage system based on DHT and
erasure code technique based on the cauchy matrix are studied, and the coding
arithmetic and data updating strategy of cauchy code are improved. The main work is
summarized as follows:
1. The design principles of the distributed hash table and basic principles of several
kinds mon DHT protocols are summ