1 / 8
文档名称:

数据工程师培训题库(四).doc

格式:doc   大小:73KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据工程师培训题库(四).doc

上传人:guoxiachuanyue008 2021/8/6 文件大小:73 KB

下载得到文件列表

数据工程师培训题库(四).doc

文档介绍

文档介绍:: .
TDH数据平台认证工程师试题
姓名: 分数:
【说明】
a) 客观题30题,每题2分,总计60分
b) 主观题4题,每题10分,总计40分
c) 满分100分。
【不定项选择题(每题 2分共60分)】
1、 下列与HDFS有关的说法正确的是( )
A. HDFS DataNode节点上的磁盘需要做 RAID1,用来保证数据的可靠性
B. HDFS可以在磁盘之间通过 balanee操作,平衡磁盘之间的负载情况
C. HDFS建议DataNode之间的数据盘个数、容量大小不一致,以体现 HDFS的负载 均衡能力
D. 规划HDFS集群时,建议 Active NameNode和Standby NameNode分配在不同的 机架上
2、 以下哪个服务作为 HDFS高可靠协调服务的共享存储?( )
A.
ZooKeeper
B.
Journ alNodes
C.
NameNode
D.
ZKFailoverCo ntroller
3、 在集群中配置 HDFS的副本数为3,设置数据块大小为 128M,此时我们上传一份 64M 的数据文件,该数据文件占用 HDFS空间大小为( )
A . 64M
B . 128M
C . 384M
D . 192M
4、 在Yarn服务中,不包含以下哪种角色( )
A . ResourceMa nager
B . NodeMa nager
C . Applicatio nM aster
D . Con tia ner
5、 ResourceManager是YARN的主要组成部分,有关其功能描述不正确的是( )
A .它直接将集群所拥有的资源按需分配给运行在 YARN上的应用程序
B. 它负责将集群中的所有资源进行统一管理和分配
C. 它接受各个节点的资源汇报信息
D. 它把资源按照策略分配给各应用
6、 当前用户提交了一个 wordcount词频统计的任务,最后任务执行失败,可能的原因有
哪些( )
A .当前集群中没有足够的资源,不足以满足当前 wordcount任务的需求
B .执行该任务的用户没有权限访问 HDFS上的数据文件
C .用户在执行任务之前在 HDFS相应的目录下创建了提交任务时指定的输出目录

7、 以下关于外表和托管表描述正确的是( )
A、 外表的数据存储在本地,托管表的数据存储在 hdfs上
B、 删除托管表只会删除Inceptor上的元数据不会删除数据文件, 删除外表两者都会 被删除
C、 删除外表只会删除Inceptor上的元数据不会删除数据文件, 删除托管表两者都会 被删除
D、 删除托管表或外表,incepotr上的元数据和数据文件都会被删除
& SQL运行中如果出现maptask数据特别多,执行时间又很短时可以通过小文件合并来 进行优化,以下是合并参数有( )
A. SET n on .automerge = TRUE;
B. SET n n. mergesize