1 / 78
文档名称:

基于HDFS的多用户并行文件IO的设计与实现.pdf

格式:pdf   页数:78
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于HDFS的多用户并行文件IO的设计与实现.pdf

上传人:banana 2014/2/8 文件大小:0 KB

下载得到文件列表

基于HDFS的多用户并行文件IO的设计与实现.pdf

文档介绍

文档介绍:国防科学技术大学
硕士学位论文
基于HDFS的多用户并行文件IO的设计与实现
姓名:金松昌
申请学位级别:硕士
专业:计算机科学与技术
指导教师:方滨兴;杨树强
2010-11
国防科学技术大学研究生院学位论文

摘要
随着计算机网络及其应用的快速发展,特别是 Google 提出基于 的海
量数据存储和 Map-reduce 并行计算思想以来,网络化的数据存储管理和并行分析
处理成为学术界和产业界研究的焦点,其中 Hadoop 作为该思想的参考实现之一,
受到了广泛的关注。
Hadoop 的核心 HDFS 分布式文件系统采用锁机制控制文件并行 IO,不支持多
用户对同一文件的读、写并行,限制了多用户并行文件操作的性能,为此,本文
针对海量日志类型数据的特点,提出了一种非基于锁机制的并行文件 IO 模型,并
通过实验,验证了本模型的有效性。
本文主要工作包括:
(1)对 Hadoop 的相关工作进行了深入的分析,特别在深入分析其分布式文
件系统 HDFS 的基础上,针对 HDFS 不支持多用户文件并行读写的不足,提出了
使其支持多用户并行文件读写的改进思想。
(2)通过分析 HDFS 的并发控制模型,针对海量日志类数据特点,提出了一
种不使用互斥机制的分布式文件系统的多用户并行 IO 模型,基于该模型,在适当
降低数据读取完整性的条件下,可以实现对于同一个文件的多用户读写并行、读
读并行。
(3)通过对原有 HDFS 实现的改进,设计实现了一个支持多用户并行 IO 的
分布式文件系统。实验表明,本改进有效提高了多用户并行文件 IO 的性能。


主题词:海量数据管理,分布式文件系统,Hadoop,并行文件 IO
第 vi 页
国防科学技术大学研究生院学位论文

ABSTRACT
With the rapid development works and its applications, especially
since Google proposed -based mass data storage and Map-reduce parallel
computing ideas, data storage management based work and parallel analysis and
processing has e the focus of academia and industry. As one of the reference
implementation of the idea, Hadoop has been widespread concern.
In order to control file parallel IO, the core of Hadoop— Hadoop Distributed File
System(HDFS) use lock mechanism, but does not support multiple users read and write
in parallel on the same file. So, this paper proposes a parallel file IO model based on
Block granularity, and finally experiments to verify the availability of this model.
In this paper, the main works are:
(1) Related work on Hadoop was deeply analyzed, particularly on Hadoop
distributed file system (HDFS), because of the deficiency of Hadoop on multi-user file
parallel IO, improvement ideas was taken out in this paper.
(2) By analyzing the implementation of Hadoop, A multi-user parallel IO model
without mutual exclusion mechanism was proposed for distributed file system, based on
the model, under the right condition of red

最近更新

2026年c语言上机期末考试题(培优) 13页

2026年c语言期末测试题(b卷) 13页

2026年c语言考期末试题学生专用 13页

2026年主管中药师考试备考题100道附完整答案【.. 37页

2026年卧底笔试题库100道含完整答案(考点梳理.. 39页

2026年吉安幼儿师范高等专科学校单招职业技能.. 44页

2026年数组c语言考试题库及参考答案一套 13页

2025年重庆传媒职业学院单招职业倾向性考试题.. 43页

2026江苏常州市儿童医院招聘高层次人才考试考.. 49页

化学试卷答案东北师大附中2025-2026学年上学期.. 1页

2025年黑龙江民族职业学院单招职业倾向性测试.. 45页

2025广信区人民法院公开招聘14人参考题库必考.. 52页

2025江西诚达工程咨询监理有限公司外包员工招.. 45页

2025浦发银行昆明分行招聘考试题库附答案解析.. 48页

2025福建南平建达集团建设工程管理有限公司招.. 47页

2025锦州市部分事业单位赴高校公开招聘2026年.. 47页

2026云南西双版纳州景洪市公安局招聘警务辅助.. 48页

2026年C语言专升本真题(夺冠) 13页

2026年c语言文件考试题库完整版 13页

2026年c语言竞赛试题及答案(各地真题) 13页

2026年c语言设计考试题库学生专用 13页

2026年安徽城市管理职业学院单招职业适应性考.. 37页

2025年湖南省建设工程工程量清单计价办法(新).. 51页

2025年江西信息应用职业技术学院单招职业适应.. 127页

2025年江西信息应用职业技术学院单招职业倾向.. 73页

喝酒给老婆的检讨书 6页

vae乳液低温发泡工艺 29页

《口蹄疫》ppt课件 42页

自然条件对城市的影响 48页

DL T 5783-2019《水电水利地下工程地质超前预.. 36页