文档介绍:6、下列计算框TDHi数据平算台认是正工程师试题
MapReduce
B . MATLAB 姓名: 分数:
【说
a) 客观题30题,每题2分,总计60分
b) 主观题4题,每题10分,总计40分
7、满下关0始流为org_stream,以下实现正确的是( )
CREATE STREAMWINDOW traffic_stream AS SELECT * FROM original_stream STREAM w1 AS (length '1' minute slide '24' hour);
CREATE STREAM traffic_stream AS SELECT * FROM original_stream
STREAMWINDOW w1 AS (length '1' minute slide '24' hour);
CREATE STREAM traffic_stream AS SELECT * FROM original_stream
STREAMWINDOW w1 AS (length '24' hour slide '1' minute);
CREATE STREAM traffic_stream AS SELECT * FROM original_stream AS (length '24' second slide '1' minute);
16、 以下不是Zookeeper的功能是( )
配置管理
集群管理
分布式锁
存储大量数据
17、 以下服务需要与zookeeper进行通信的是( )
HMaster
Active NameNode
InceptorSQL
Active ResourceManager
18、 下列是关于flume和sqoop对比的描述,不正确的是( )
A . flume主要用来采集日志而sqoop主要用来做数据迁移
B . flume主要采集流式数据而sqoop主要用来迁移规范化数据
C . flume和sqoop都是分布式处理任务
D . flume主要用于采集多数据源小数据而sqoop用来迁移单数据源数据
19、 有关使用sqoop抽取数据的原理的描述不正确的是( )
A . sqoop在抽取数据的时候可以指定map的个数,map的个数决定在hdfs生成的 数据文件的个数
B . sqoop抽取数据是个多节点并行抽取的过程,因此map的个数设置的越多性能 越好
C . sqoop任务的切分是根据split字段的(最大值-最小值)/map数
D . sqoop抽取数据的时候需要保证执行当前用户有权限执行相应的操作
20、 sqoop抽取数据时需要做一些数据转换的工作,下面说法不正确的是( )
A . --fields-terminated-by ‘\\01’用来设置在hdfs生成的文件的分割符
B . --hive-drop-import-delims用来设置在hdfs生成的文件的存储形式为列存储
C . --null-string '\\N'用来把所有的String类型的空值 转换成hive的NULL值
D . --null-non-string '\\N'用来把非String类型的空值 转换成hive的NULL值
21、 下列有关flume的描述不正确的是( )
A . flume是Apache的一个子项目
B . flume主要是一个日志采集,传输系统
C . flume和sqoop功能相似,因此可以相互替代
D . flume可以同时采集集群内部和集群外部的日志数据
22、 下列sink中哪些是flume不支持的sink( )
A . HDFS sink
B . kafka sink
C . memory sink
D . file roll sink
23、 以下对ElasticSearch描述不正确的是( )
ElasticSearch是分布式全文搜索引擎
ElasticSearch 集群中分 master 和 data 节点
ElasticSearch 数据存储在 HDFS 上
ElasticSearch数据可以按Shard分布在不同的节点上
24、 下列不属于kafka应用场景的是( )
常规的消息收集
网站活动性跟踪
C . 日志收集
25、 TDH提供哪几种认证模式?( )
所有服务使用简单认证模式一一所有服务都无需认证即可互相访问
所有服务都启用Kerberos认证,用户要提供Kerberos principal和密码(或者 keytab)来访问各个服务
所有服务都启用Kerbe