文档介绍：大数据面试题
大数据面试题
大数据面试题
HDFS 数据储存。
a)NameNode
b)Jobtracker
c)Datanode
d)seconda单磁盘破坏，影响整个节点运转。( )
HDFS 有多个副本，因此 NameNode 是不存在单点问题的。 ( )
map 槽就是一个线程。 ( )
Mapreduce 的 input split 就是一个 block。( )
NameNode 的 Web UI 端口是 50030，它经过 jetty 启动的 Web 服
务。( )
护线程的内存。它默认是 200 GB。( )
DataNode 初次加入 cluster 的时候，假如 log 中报告不兼容文件版本，那需要 NameNode 履行 “Hadoopnamenode-format ”操作格式化磁盘。 ( )
别走开，答案在后边哦 !
答案
单项选择题
HDFS 数据储存。答案 C datanode
大数据面试题
大数据面试题
大数据面试题
4/12
大数据面试题
大数据面试题
大数据面试题
a)NameNode
b)Jobtracker
c)Datanode
d)secondaryNameNode
e)tasktracker
HDfS中的 block 默认保留几份答案 A 默认 3 分
a)3 份
b)2 份
c)1 份
d)不确立
NameNode 在一个节点启动答案 D
a)SecondaryNameNode
b)DataNode
c)TaskTracker
d)Jobtracker
本题剖析：
hadoop 的集群是鉴于 master/slave 模式， namenode 和 jobtracker 属于master，datanode 和 tasktracker 属于 slave，master 只有一个，而 slave 有多个SecondaryNameNode内存需乞降 NameNode 在一个数目级上，因此往常 secondary NameNode(运转在独自的物理机器上 )和 NameNode 运转在不一样的机器
上。 JobTracker和 TaskTracker
JobTracker 对应于 NameNode
大数据面试题
大数据面试题
大数据面试题
大数据面试题
大数据面试题
大数据面试题
5/12
大数据面试题
大数据面试题
大数据面试题
TaskTracker 对应于 DataNode
DataNode 和 NameNode 是针对数据寄存来而言的
JobTracker和 TaskTracker是对于 MapReduce 履行而言的
mapreduce 中几个主要观点， mapreduce 整体上能够分为这么几条履行线索： obclient，JobTracker与 TaskTracker。
1、JobClient会在用户端经过 JobClient类将应用已经配置参数打包成 jar 文
件储存到 hdfs，并把路径提交到 Jobtracker,而后由 JobTracker创立每一个Task(即 MapTask 和 ReduceTask)并将它们散发到各个 TaskTracker服务中去履行。
2、JobTracker是一个 master 服务，软件启动以后 JobTracker接收 Job，负
责调动 Job 的每一个子任务 task 运转于 TaskTracker上，并监控它们，假如发现有失败的 task 就从头运转它。一般状况应当把 JobTracker部署在独自的机器
上。 JobTracker通信，接收作业，并负责直接履行每一个任务。 TaskTracker都需要运转在 HDFS的 DataNode 上。
Hadoop 作者答案 C Doug cutting a)Martin Fowler
b)Kent Beck
c)Doug cutting
5. HDFS默认 Block