文档介绍:第一章 大数据概述
个阶段。
A. — C 二
下列不属于大数据特点的是(
)。
互联网发展的第 个时代为智件系统
1.
机器上。
下列关于hadoop系统架构叙述不正确的一项为
由一台In tel x86处理器的服务器或 PC机组成。
部署在低成本Intel/linux硬件平台上。
C通过高速局域网构成一个计算集群。
ux操作系统。
主节点程序.
从节点程序
ndaryNameNode
HDFS结构不包括 。
ndaryNameNode
C元数据服务器
是指跨多台计算或服务器的文件或文件夹,数据存储在多台机器而不是单台
精选文库
7
HDFS分布式文件系统的特点为 。
半透明性 B低可用性
HDFS中的block默认保存 份。
下列 通常与NameNode在一个节点启动。
Sec on daryNameNode
DataNode
TaskTracker
.大小的多个block,属于同一个文件的 blocks分散存储在不
HDFS每个文件被划分成 同 DataNode 上。
32MB
64MB
128MB
无法确定
下面哪个程序负责 HDFS数据存储?()
NameNode
JobTracker
DataNode
Sec on daryNameNode
tasktracker
NameNode是HDFS系统中的管理局节点, 它管理文件系统的命名空间, 记录每个文件数
据块在DataNode上的位置和副本信息、协调客户端对文件的访问、记录命名空间内的改动
和空间本身属性的改动。
精选文库
20
错误 B正确
HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠行、高扩展性、高吞吐率等特征,适合的读写任务是
精选文库
9
少次读取 少次读取 多次读取 多次读取
一次写入,
多次写入, C多次写入,
—次写入,
关于HDFS的文件写入,正确的是
支持多用户对同一文件的写操作
用户可以在文件任意位置进行修改
C默认将文件复制成三份存放
Clie nt在HDFS上进行文件写入时, name node根据文件大小和配置情况,返回部分
data node信息,谁负责将文件划分为多个 Block,根据DataNode的地址信息,按顺序写入
到每一个DataNode块
Clie nt
Name node
Data node
Sec on dary n ame node
HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
利用SequenceFile、MapFile、Har等方式归档小文件 多Master设计
Block大小适当调小
调大name node内存或将文件系统元数据存到硬盘里
A.
B.
C.
D.
精选文库
10
在HDFS的数据读取过程中,客服端首先调用
件。
的实例的
open()方法打开一个文
在HDFS的数据读取过程中,
对象实例返回给客户端。
putSystem
DistributedFileSystem 获取这些信息后,
putSystem
生成一个
pu tSystem
在HDFS的数据读取过程中, 口关闭这个文件。
putSystem
在HDFS的数据写入过程中, 件。
np utSystem
tSystem
客户端读取完所有数据块后,调用
np utSystem
tSystem