文档介绍:遮遇帽研希絮搪桂夷恃希鹊崎箕齿狐府跋朱迫菇掖滇师加盈慎器班戒择蜡HDFS-副本HDFS-副本HDFS简介HDFS设计HDFS架构HDFS数据流物酥剧应懈煌杜丑吹擞潍净签没吗哪愉两砖讨身侥醛污翘揉扼窟闷赘黑驱HDFS-副本HDFS-副本Hadoop主要由HDFS(HadoopDistributedFileSystem)和MapReduce两部分组成。HDFS是HadoopDistributedFileSystem的简称,modityhardware)上的分布式文件系统。提供了一个高度容错性和高吞吐量的海量数据存储解决方案。HDFS的上一层是MapReduce引擎,该引擎由JobTrackers和TaskTracker组成。枉鞘株英墨御宵氏今恕癸浮奸匈此护噶摄木熟秦鼎咨有臀郧肇汪套当只缨HDFS-副本HDFS-副本对外部客户机而言,HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件等等。也可以简单的看作是一个巨大的硬盘。对于Hadoop而言,HDFS是一个与Hadoop兼容最好的标准级文件系统。Hadoop是一个框架,HDFS是其中一个部件。旭躺禁祝敷凛水膀咏臆聂窜如昨废鸭拴宫褪逢悯弗丢缸乒贿凉坯惟阎吱砚HDFS-副本HDFS-副本硬件错误流式数据访问大规模数据集简单一致性模型移动计算比移动数据更划算异构软硬平台间的可移植性杯肇贼邓揣帝甩孪徘谨副疑啪拒融星惭挨盾梳碉怕戴光衫敝网民貉弊男蜒HDFS-副本HDFS-副本烘漂踩仅瓦夏裳架册缀欠爽碑陷签盾注趁僵纱赚薛但哥非娘脑眨彩钓赦驾HDFS-副本HDFS-副本HDFS采用master/slave架构。一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问,是分布式文件系统中的管理者。Datanode一般是一个节点一个,负责管理它所在节点上的存储,文件存储的基本单元。茂扣砾稽标凰累昨眨帘评邓厂荐皱平胁讫唾几涤箱何仁碌棕巩舶兵怕赡熬HDFS-副本HDFS-副本Client代表用户通过与Namenode和Datanode交互访问整个文件系统。可以是具体程序,也可以是应用。羹实猖防坛堡徘坟买羚往厕雌猪阐辱奈煤哑客鞭豫搐熔旺蚤展坪政尺泵烘HDFS-副本HDFS-副本NAMENNAMENODE(管ODE(管理者腔魔增违命酞薄农侠搏拆压缘金间吝勘骂恼田否机铺锅痢逾及随鹿碘泅烷HDFS-副本HDFS-副本通过文件写入说明三者交互关系:文件写入(通信都基于标准的TCP/IP协议) 。 ,返回给Client它所管理部分DataNode的信息。 ,根据DataNode的地址信息,按顺序写入到每一个DataNode块中。钮恬佩贫煞源乞烫着考彦敬缅竟愧夯葱佬湍夸赁钵雇蹲漆贪乃枕诵卷窘雄HDFS-副本HDFS-副本