1 / 12
文档名称:

最新大数据试题.docx

格式:docx   大小:43KB   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

最新大数据试题.docx

上传人:sunny 2022/3/20 文件大小:43 KB

下载得到文件列表

最新大数据试题.docx

相关文档

文档介绍

文档介绍:大数据试题
一、填空题〔将正确的答案写入答题纸中。每空1分,共20分〕
1、HDFS有 _ NameNode__ _,_ DataNode__ _和_ SecondaryNameNode__ _组成;
2、Hadoop集群可以层使用〔A〕实现。
A MapReduce
B Hive
C Coprocessor
D Bloom Filter
三、简答题〔将正确的答案写入答题纸中。每题5分,共20分〕
1、简述下HDFS 数据读流程;
答:步骤如下,能大致描述清楚流程,没有关键错误即可
1、跟namenode通信查询元数据〔block所在的datanode节点〕,找到文件块所在的datanode效劳

2、挑选一台datanode〔就近原那么,然后随机〕效劳器,请求建立socket流
3、datanode开始发送数据〔从磁盘里面读取数据放入流,以packet为单位来做校验〕
4、客户端以packet为单位接收,先在本地缓存,然后写入目标文件,后面的block块就相当于是append到前面的block块最后合成最终需要的文件。
2、如何查看hadoop 进程并列出hadoop的几个进程名
答:使 用jps命令可查看hadoop进程。 Namenode, SecondaryNameNode,Datanode ,ResourceManager, NodeManager
3、请简述MapReduce中combiner、partition的作用
答:
combiner:
有时一个map可能会产生大量的输出,combiner的作用是在map端对输出先做一次合并,以减少网络传输到reducer的数量。
注意:mapper的输出为combiner的输入,reducer的输入为combiner的输出。
partition:
把map任务输出的中间结果按照key的范围划分成R份(R是预先定义的reduce任务的个数),划分时通常使用hash函数,如:hash(key) mod R
这样可以保证一段范围内的key,一定会由一个reduce任务来处理。
4、HBase的检索支持3种方式是哪些?
答:
〔1〕 通过单个Rowkey访问,即按照某个Rowkey键值进行get操作,这样获取唯一一条记录;
〔2〕 通过Rowkey的range进行scan,即通过设置startRowKey和endRowKey,在这个范围内进行扫描。这样可以按指定的条件获取一批记录;
〔3〕 全表扫描,即直接扫描整张表中所有行记录。
四、程序题〔将正确的答案写入答题纸中。每题10分,共20分〕
1、以一段文本作为输入对象,写一个WordCount程序。
例如文本数据的情况如下
统计出文本中每个单词出现的次数,输出结果如下面例子所示
答:
public class WordCount {
public static class TokenizerMapper
extends Mapper<Object, Text, Text, IntWritable> {
private final static IntWritable one = new IntWritable(1);
private Text word = new Text();
public void map(Object key, Text value, Context context
) throws IOException, InterruptedException {
StringTokenizer itr = new StringTokenizer(());
while (()) {
(());
(word, one);
}
}
}
public static class IntSumReducer
extends Reducer<Text,IntWritable,Text,IntWritable> {
private IntWritable result = new IntWritable();
public void reduce(Text key, Iterable<IntWritab

最近更新

2025-2030年中国100#沥青行业深度研究分析报告.. 29页

心脏介入治疗与护理 39页

2024气凝胶行业市场分析报告 26页

2024年锦纶纤维项目评估报告 24页

2025年颈椎侧弯康复攻略与日常保养 27页

2025年重症休克患者护理策略与实践 40页

2024年缠绕膜市场调查报告 20页

2024年红外线灯项目评估报告 22页

2025年偏瘫患者康复训练新疗法探讨 99页

2025年教师工作反思总结自我反思 27页

2025年教师实习考核工作总结5篇 23页

2024年电磁铁项目可行性研究报告 28页

2024年电力变压器项目深度研究分析报告 21页

2024年灌封胶项目申请报告范文 21页

2024年氧化锆陶瓷粉料项目投资分析及可行性报.. 21页

2024年树脂家居用品行业市场调研报告 20页

2025年教师个人学期总结模板五篇 15页

2024年智慧能源项目可行性研究报告 22页

2024年新材料产业园区项目投资分析及可行性报.. 21页

2025年肾健康关爱你我 57页

2024年手机玻璃盖板项目可行性研究报告 20页

2025年教务工作心得体会 54页

2025年教你快速被公司录用妙法 2页

2024年工程师述职报告参考范文(3) 25页

2025年政治总结反思300字 31页

2024年大数据项目可行性分析报告 25页

二零二四年酒店集团年度人力资源合作协议范本.. 14页

雷雨剧本全文雷雨剧本雷雨 191页

市政道路沟槽土方开挖工程专项施工方案 12页

《中国轻工业联合会科学技术奖申报书》填写说.. 8页