1 / 179
文档名称:

大数据平台简介.ppt

格式:ppt   大小:7,513KB   页数:179页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据平台简介.ppt

上传人:相惜 2020/2/17 文件大小:7.34 MB

下载得到文件列表

大数据平台简介.ppt

相关文档

文档介绍

文档介绍:(安装部署工具)Zookeeper(分布式协调服务)HBase(分布式协数据库)Oozie(作业流调度系统)HDFS(分布式存储系统)YARN(分布式计算框架)MapReduce(离线计算)Tez(DAG计算)Spark(内存计算)HivePigMahoutSqoop(数据库TEL工具)Flume(日志收集)…………HDFS-HadoopDistributedYarn-资源管理器MapReduce-分布式并行计算框架“你数一号书架,我数二号书架。我们人数多,数书就更快。这就是map;最后我们到一起,把所有人的统计数加在一起,就是reduce。”Spark-新一代大数据处理计算引擎YoucanrunSparkusingitsstandaloneclustermode,onEC2,onHadoopYARN,,Cassandra,HBase,Hive,Tachyon,-NoSQL数据库