文档介绍:word
word
word
单项选择题
HDFS 数据存储。
a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker命令操作对象是
A. 文件
B. 目录
C. 两者都是
答案:C
,在安全模式阶段,说法错误的答案是
A. 安全模式目的是在系统启动时检查各个DataNode上数据块的有效性
B. 根据策略对数据块进展必要的复制或删除
C. 当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式
D. 文件系统允许有修改
word
word
word
答案:D
21. 如下关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的答案是A.    FSDataInputStream扩展了DataInputStream以支持随机读 B.    为实现细粒度并行,输入分片(Input Split)应该越小越好 C.    一台机器可能被指派从输入文件的任意位置开始处理一个分片 D.    输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割答案:B
多项选择题
1. 关于 SecondaryNameNode 哪项是正确的?
a)它是 NameNode 的热备
b)它对内存没有要求
c)它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间
d)SecondaryNameNode 应与 NameNode 部署到一个节点
答案C D
2. 如下哪项可以作为集群的管理?
a)Puppet b)Pdsh c)Cloudera Manager d)Zookeeper
答案1:ABC
word
word
word
3. 配置机架感知的下面哪项正确
a)如果一个机架出问题,不会影响数据读写
b)写入数据的时候会写到不同机架的 DataNode 中
c)MapReduce 会根据机架获取离自己比拟近的网络数据
答案ABC
具体可以参考
hadoop机架感知--加强集群稳固性,该如何配置hadoop机架感知
4. Client 端上传文件的时候如下哪项正确
a)数据经过 NameNode 传递给 DataNode
b)Client 端将文件切分为 Block,依次上传
c)Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作
答案B
5. 如下哪个是 Hadoop 运行的模式
a)单机版 b)伪分布式 c)分布式
答案ABC
6. Cloudera 提供哪几种安装 CDH 的方法
a)Cloudera manager b)Tarball c)Yum d)Rpm
答案:ABCD具体可以参考
Hadoop CDH四种安装方式总结与实例指导
word
word
word
简答题
?
1)单机〔本地〕模式;
2)伪分布式模式;
3)全分布式模式;
〔本地〕模式中的注意点?
在单机模式〔standalone〕中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序,这也是最少使用的一个模式。
?
伪分布式〔Pseudo〕适用于开发和测试环境,在这个模式中,所有守护进程都在同一台机器上运行。
4. 全分布模式又有什么注意点?
全分布模式通常被用于生产环境,这里我们使用N台主机组成一个Hadoop集群,Hadoop守护进程运行在每台主机之上。这里会存在Namenode运行的主机,Datanode运行的主机,以与task tracker运行的主机。在分布式环境下,主节点和从节点会分开。
5. Hadoop是否遵循UNIX模式?
是的,在UNIX用例下,Hadoop还拥有“conf〞目录。
6. Hadoop的核心配置是什么?
Hadoop的核心配置通过两个xml文件来完成:1,hadoop-;2,hadoop-。这些文件都使用xml格式,因此每个xml中都有一些属性,包括名称和值,但是当下这些文件都已不复存在。
word
word
word
7. 那当下又该如何配置?
Hadoop现在拥有3个配置文件:1,core-;2